ナレッジ

オープンデータを使った機械学習の適用事例:医薬品営業戦略の場合

FA Innovative Senses 第14回

オープンデータを使った機械学習を行い、ジェネリック医薬品の需要が高い地域の特徴の分析を事例を交えて紹介するとともに、本分析を活用した効率的な営業戦略を解説します。

1. はじめに

オープンデータとは、官公庁をはじめとする公的機関や研究機関が公開する、誰でも無償で利用ができ、二次利用が可能なデータのことを指す。このオープンデータは昨今整備が進んでおり、医療、交通、環境、経済など多様な領域を網羅しており、信頼性が高く、誰でもアクセス可能であるため、我が国が抱える様々な社会課題の解決に大きなポテンシャルがある。今回は特に医療分野に特化し、医薬品の処方数量に関するオープンデータに対して、機械学習モデルを適用し、医療費の高騰という日本が直面する重大な課題に対する活用事例を紹介する。国民皆保険制度を有する日本は、国民の高齢化等による医療費の高騰が大きな問題となっている。この問題改善のために、政府は先発医薬品と同一の効果を持ちながらも、比較的安価で提供が可能なジェネリック医薬品の利用割合を高める施策を続けてきた。厚生労働省は令和6年3月14日の第176回社会保障審議会医療保険部会にて、ジェネリック医薬品に係る新目標としてジェネリック医薬品の数量シェアを、2029年度末までに全ての都道府県で80%以上とする目標を掲げるなど、更なる使用率向上施策が進行している。一方で上記のジェネリック医薬品利用を促進する流れに反し、ジェネリック医薬品は業界全体で供給不足という大きな課題を抱えている。薬価改定や原材料費の高騰による利幅の縮小によって不採算品目が増加しており、それを埋め合わせるために多品目少量生産が常態化している。その結果、十分な量の在庫量を確保できておらず、国民の需要に見合った供給を提供できていない可能性がある。上記の背景に起因して、近年ではジェネリック医薬品メーカー各社において、ジェネリック医薬品の製造販売承認申請資料から逸脱した不正製造が相次いで発覚し、大きな問題となった。医薬品は国民生活の健康的生活に必要不可欠な物資であり、上記の課題解決に向け、官民一体となった改善への取組が行われている。

こうした状況の中で、ジェネリック医薬品メーカーが限られた生産リソースを効率的に活用し、効率的に薬剤の供給を実現するためには、ジェネリック医薬品需要の高い地域を特定したうえで戦略的に営業活動を展開することが重要となる。なお、この手法は医薬品業界に限らず、他の業界でも有効に活用することができる。例えば、小売業界では消費者の購買パターンを分析し、需要が高い地域に新店舗を開設することで売上を最大化することが期待される。需要の高い地域の特定のためには過去の営業実績データの活用の他、人口動態などの周辺環境の状況を取り入れる必要があるが、周辺環境データはデータ項目が多岐に渡るため、これらを取り入れた分析を行うためには機械学習モデルの構築が有効となる。

今回は過去にジェネリック医薬品の需要上昇が顕著に起こった地域の特徴分析において、機械学習モデルがどのように適用できるかを紹介し、実際のデータを使ったうえでの結果について考察を行う。本分析を応用することで自社薬剤が属する薬効の需要が高まる地域の特徴や新たなパターンを見つけ出し、ニーズの高い新規開拓エリアの特定に繋げることができる可能性が考えられる。

2. 機械学習モデル構築のための利用データの整理

今回の分析では国内における症例数が多く、且つジェネリック医薬品の需要増加が期待される疾患領域を対象とする。厚生労働省が発表している日本国内の死因の集計では、がん、循環器官系、神経系の疾患が死因の上位に含まれる。よって、これらの疾患に対する薬効である「腫瘍用薬」(薬効分類42)、「循環器官用薬」(薬効分類21)、「中枢神経系用薬」(薬効分類11)に絞り、これらの薬効が今後上昇トレンドとなる都道府県の特徴を抽出する。

参考: 厚生労働省「令和5年(2023) 人口動態統計月報年計(概数)の概況」(https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/geppo/nengai23/index.html)をもとに作成

本分析を実施するにあたり、政府より公開されている2種類のオープンデータを活用した。厚生労働省が公開する匿名医療保険等関連情報データベース(「NDB」)オープンデータは、平成20年4月から施行されている「高齢者の医療の確保に関する法律」に基づき構築され、レセプト情報や特定健診・特定保健指導情報などが格納される。主要なデータ項目は、基本診療料、医学管理等、在宅医療、検査、画像診断等の多様な項目のデータが利用可能で、本分析においては、薬剤に関するデータの中から、内服、外用、注射に分類される薬効の都道府県別の処方量のデータを活用し、都道府県別の処方薬剤や薬効の傾向分析を行う。

また、人口動態に関する以下データ項目についてもオープンデータから取得し分析に活用した。

  • 性年齢別人口
  • 一般診療所数(人口10万人当たり)
  • 一般病院数(人口10万人当たり)
  • 薬局数
  • 傷病大分類ごとの受療率(人口10万人当たり)


性年齢別人口は「人口推計」(総務省統計局)を加工して使用した。一般診療所数(人口10万人当たり)、一般病院数(人口10万人当たり)、薬局数については「統計でみる都道府県のすがた」(総務省)を加工して使用した。傷病大分類ごとの受療率(人口10万人当たり)は「患者調査」(厚生労働省)を加工して使用した。

3. ジェネリック医薬品需要増加地域の特定と機械学習モデルの構築

前述オープンデータを活用した機械学習モデルの構築手法として、以下の手順を採用した。

① データ抽出:NDBオープンデータから対象となる薬効のデータを抽出

② 探索的データ分析:データの基本統計量や分布を確認し、ジェネリック医薬品の数量シェアの上昇率を集計

③ 特徴量抽出:ジェネリック医薬品の数量シェアの上昇率を目的変数にして、決定木による分析を行うことで、都道府県別の特徴量を抽出し、需要が上昇する地域の特性を分析

まず、ジェネリック医薬品の数量シェアの上昇率の計算を各都道府県で行う。ここで、ジェネリック医薬品のシェア上昇率は、2019年度から2022年度までの3年間の数量シェア平均上昇率によって計算をした。各年度のジェネリック医薬品の数量シェアは厚生労働省の算出基準に則り以下の式で計算する。

ジェネリック医薬品の数量シェア(置換え率) = [ジェネリック医薬品の医薬品の数量] / ([ジェネリック医薬品のある先発医薬品の数量] + [ジェネリック医薬品の数量])  

ここで、厚生労働省の計算定義では、下記条件の医薬品は集計対象から除かれていることに注意が必要である。

  • ジェネリック医薬品のある先発医薬品のうち、ジェネリック医薬品と同額又は薬価が低いもの
  • ジェネリック医薬品のうち、先発医薬品と同額又は薬価の高いもの

その算出結果から、ジェネリック医薬品の数量シェアの上昇率を目的変数にして、高需要都道府県の特徴パターンを判別する機械学習モデル構築を行う。ここで機械学習モデルは決定木分析によるものを利用し、高需要(もしくは低需要)の都道府県における典型的特徴についての可視化を行った。分析の結果を以下の通り、3つの薬効「腫瘍用薬」、「循環器官用薬」、「中枢神経系用薬」毎に示す。

決定木分析の結果、「腫瘍用薬」のジェネリック医薬品の需要が高い都道府県の特徴は下図の通りである。

この結果より、「40~59歳男性の割合が一定数以上」、「人口当たりの一般病院数が7.4か所以上」、「女性の若年成人割合が比較的低い」の3つの条件がそろった場合、腫瘍用薬のニーズが最も高くなることが分かった。これらの特徴は富山県などの北陸地方、徳島県、高知県などの四国地方の都道府県が該当する。

同様の分析手法を「循環器官用薬」に適用した場合、以下のような結果となった。

これより循環器官用薬においては「20歳未満の男性割合が比較的低い地域」、「10万人当たりの一般診療所数が多い」、「80歳以上の男性割合が高い」の3つの条件で需要の上昇が見込まれる。これらの特徴は京都府、大阪府、奈良県などの関西地方が該当する。

「中枢神経系用薬」の場合は以下のような結果となった。

シェア上昇率の高低を決定する条件は循環器官用薬と類似しているが、加えて「男性の若年成人割合が低い」都道府県は、より「中枢神経系用薬」のニーズが見込めることが明らかになった。これらの特徴は奈良県、和歌山県などの関西地方が該当するほか、徳島県、高知県など四国地方も該当する。

4. 結論

本分析は戦略的に営業活動を展開することを目的に、ジェネリック医薬品の需要が上がると想定される都道府県を特定し、それらの地域の特徴の抽出を試みたものである。

日本国内でも国民の死因として挙げられることも多い疾患に対して、需要が上昇トレンドにある都道府県の特徴を明らかにした。本分析を応用することで、ジェネリック医薬品メーカー各社は自社の営業エリアの特徴と照合し、上記の薬効に属する自社薬剤の需要が増加する都道府県を推定することができる。以下の図5で本分析を潜在ニーズの高い新規営業エリアの発見を目的に応用する想定フローを示す。

 

本分析においては都道府県レベルの粒度にとどまっているが、より解像度の高い営業戦略を策定するうえで、薬効内の薬剤種別や地域粒度を絞り市区町村粒度で分析することも可能である。

※本文中の意見や見解に関わる部分は私見であることをお断りする。

執筆者

デロイト トーマツ ファイナンシャルアドバイザリー合同会社
Digital
マネジャー 堀川 峻洋
コンサルタント 仲井間 憲志
アナリスト 井上 和真

(2024.10.11)
※上記の社名・役職・内容等は、掲載日時点のものとなります。

FA Innovative Sensesシリーズ

シリーズ記事一覧

記事、サービスに関するお問合せ

>> 問い合わせはこちら(オンラインフォーム)から

※ 担当者よりメールにて順次回答致しますので、お待ち頂けますようお願い申し上げます。

お役に立ちましたか?