日本におけるリアルワールドデータの臨床疫学への活用を目指して(論文調査研究) ブックマークが追加されました
ナレッジ
日本におけるリアルワールドデータの臨床疫学への活用を目指して(論文調査研究)
医療データベース疫学研究・メタ解析研究の調査研究
網羅的な文献レビューを通じて、国内のリアルワールドデータ(RWD)を用いた疫学研究の現状とトレンドを俯瞰する。
RWD疫学研究
RWDとは
RWD とは、リアルワールドデータ(real-world data)の略称で、医療ビッグデータ(図1)の一つであり、臨床試験やランダム化比較試験(RCT)以外の臨床現場や健康管理の現場などで収集された、患者の実際の健康状態や医療情報、治療経過などのデータのことを指す。
図1. 創薬における医療ビッグデータの利活用
RWDは、現実の医療現場でよく使用される電子カルテ(electronic medical record; EMR)や電子健康記録(electronic health record; EHR)、レセプト・特定健診、患者登録、保険データベースなどのソースから収集されている(図2)。また、モバイルデバイスやソーシャルメディアなどから収集された運動データやGPSデータ、ユーザー投稿データ、自己報告データなどもRWDの一部となる。これらのデータソースから収集されたRWDは広範で多様であり、医療決定に貴重な情報を提供し、医療分野における研究や臨床実践の発展を促進することを期待されている。
図2. RWDのデータソース
RWDと臨床試験の違い
RWDと臨床試験は、医療研究において異なる方法でデータを収集する手法であり、相補的な情報源として利用されることが多い。RWDは、現実世界での医療実践に基づいており、患者数が多く幅広い人口統計学的特徴を持つことがあるため、より広範な人口における治療効果や副作用など、現実世界における患者の状態をより正確に反映することができる。一方、臨床試験は、良質でコントロールされた条件下で行われ、特定な被験者が対象となるため、データの信頼性が高く、治療効果や安全性を正確に評価することができる。RWDと臨床試験を適切に組み合わせることで、医療の改善や新しい治療法の開発に貢献することが期待されている。
RWDのメリット
- 日常診療の環境で収集されたデータである
- 一般診療データである
- 単一のデータソースを複数の研究目的に使用可能である
- 患者数が多い
- 費用が比較的抑えられる
- 将来のデータ収集が不要
臨床試験のメリット
- RCTなどの高品質の研究デザインに基づいて収集されているため、信頼性が高い
- データの標準化が行われているため、品質が比較的高い
- 豊富な情報が開示されるため、複雑な解析が実施可能
表1. RWDと臨床試験の比較
RWD疫学研究とは
大規模RWDデータベースが整備されたことに伴い、RWDの活用が業界で広く注目されている。RWDを用いて、疾患の発生率、リスクファクター、薬剤の有効性・安全性、医療費用などを評価する研究は、RWD疫学研究と呼ばれる(以下、「RWD研究」と略記する)。RWD研究によって得られたデータはリアルワールドエビデンス(RWE)として、医療政策や医薬品の開発において、現実世界での効果や安全性を評価する上で重要な情報源となる。近年、RWD研究の出版数が急激に増加しており、RWDを活用する上で有用な情報が蓄積されつつあるが、網羅的なレビューが行われていないのが現状である。デロイト トーマツは、既存研究を調査することにより、データベースの使用状況や、分析手法や、アウトカムなどの特定な情報を集計・分析することで、RWD研究のデザインに役立つ情報を提供することを目指している。
国内のRWD疫学研究において論文調査研究
研究背景
医療クレームデータ、電子カルテ(EMR)、電子健康記録(EHR)は、RWDの一般的な情報源であり、日本では大規模な商用または非営利のデータベースが完備され、臨床疫学研究でますます使用されるようになっている。クレームデータは、患者と医療提供者間の取引の電子記録であり、提供者(病院、クリニック、薬局など)が第三者支払者(健康保険団体)に提出する請求(クレーム)に関する情報が含まれている。日本には、複数の医療提供者から情報を集約して二次利用を目的とする大規模なクレームデータベースが存在している。EMRデータは、医師がEMRシステムを介して記録した患者とのエンカウンターの詳細であり、検査結果、診断画像、病理学的所見、患者の症状などの豊富な臨床情報が含まれる。施設によっては異なるEMRシステムを使用しているため、異なる医療機関間で情報共有することができないが、国内にも一部の医療機関で利用可能なEMRデータがある。EHRデータは、個々の患者の健康に関する電子記録であり、医療従事者によって作成・管理され、異なる医療機関間で共有・使用されている。
これらのデータは研究目的のために設計されたものではないため、二次利用には、その限界を理解し、臨床的な問いを生成する能力、疫学的スキルによる研究設計、後ろ向き観察的データの分析に必要な統計スキルが必要である。先行研究では、RWDデータの利用に関する制限と課題に取り組んできたが、これらのデータを用いた既存の疫学研究の調査は不十分である。そのため、デロイトアナリティクスは、日本国内でのRWD研究の現状を明らかにするため、既存の医療クレームデータ、電子カルテ、電子健康記録データを用いた疫学研究について記述的な文献レビューを行い、総説論文を発表した[1]。
論文検索・スクリーニング
本研究では、PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses)ガイドラインに従って、生物医学分野の文献データベースであるPubMedを用いて、2006年1月1日から2021年6月30日(検索日)までの適格基準を満たす論文を探索し、2-Roundスクリーニングを実施して対象となる論文を特定した(図3)。これにより、日本国内のRWD研究を網羅的に調査した。
図3.対象論文を特定するプロセス
デロイト トーマツ独自定義の項目による情報をクロス集計
対象となる論文について、独自に定義した7つの項目の情報を集計した。各項目の分類に関する詳細は、表2に定義されている。そのうち、研究機関、研究デザイン、RWDタイプ、と疾患領域については、タイトルとアブストラクトからデロイト トーマツ独自開発の情報抽出アプローチによって自動的に情報を抽出した。一方、データベース、アウトカム、分析手法については、フールテキストをレビューし、手動的に情報を集計した。特に分析手法については、図4に示すような階層的分類法を定義し、多変量解析(Multivariate modeling)を実施した論文については、レイヤIIの実施目的と具体的に使われたモデルの情報を収集した。
表2. 独自に定義した7つの集計項目
図4. 分析手法を階層式に分類する
集計結果から国内RWD研究の現状を把握
PubMedから、2006年1月1日から2021年6月30日(検索日)までの間に、合計620件の適格な論文が特定された。これらの対象論文から集計した7つの項目に基づき、日本におけるRWD研究の実施状況と傾向を分析した。
- 対象論文数の推移
対象論文の発行年の分布から、約68.7%(426/620)の研究が2018年以降に出版されたことが示されており、日本における3つのRWDタイプのデータを用いた疫学研究が、過去5年間で広く行われたことが示唆されている(図5)。
図5. 日本における対象となる論文数の推移(検索期間:2006年1月1日―2021年6月30日)
- 主要な集計結果
620件の対象論文から集計された7つの項目の結果は図6と表3に示されている。
(1) RWD研究は主に学術機関によって行われたが、非学術機関は学術機関と共同研究する傾向がある
(2) コホート研究は主流な研究デザインである
(3) EMRとEHRは広く使われなかった
(4) 感染症、心血管疾患、と癌は最も研究された
(5) 治療パターン、生理・臨床結果、死亡率が最も評価されていた
(6) 多変量解析がよく使われており、カテゴリー変数と連続変数の分析では、それぞれロジスティック回帰と線形回帰が第一選択となることが示された
図6. 集計結果: (A) 研究機関; (B)研究デザイン; (C) RWDタイプ; (D) データベース; (E) 疾患領域; (F)アウトカム
表3. 分析手法における階層的な集計結果
- 疾患領域×アウトカム
疾患領域別のアウトカムの割合に関する調査結果は、異なる疾患によって評価されたアウトカムの傾向があることが示唆されている(図7)。一般的な疾患、慢性疾患、精神疾患では、治療パターンが主に評価され、突然発症する重症疾患では、死亡率や入院・通院がよく評価された。また、眼科疾患と治療パターン、血液・リンパ系疾患と死亡率、精神疾患と死亡率の間に強い傾向が見られたが、論文数が少ないため、臨床的重要性を反映した結論を導き出すことは困難であった。しかしながら、これらの結果から、既存研究のフォーカスや欠点などを把握することが可能になる。一方、今後は、ガイドラインの遵守を評価するRWD研究が期待されるだろう。
図7.疾患領域ごとに評価されたアウトカムの割合分布
- アウトカム×分析手法
異なるアウトカムを評価するために使用される分析手法のトレンドも調査した。調査結果によると、多変量解析には交絡因子の調整(confounding adjustment) を伴うことが多いことが示されている。また、Mortalityと、hospitalization or hospital stayと、 resource use or costsについては、他のアウトカムと比べ、よりも多層モデルまたはマージナルモデル(例えば、⼀般化推定⽅程式)を使用して解析されることが多いことが示唆されている。これは、病院関連のアウトカムはクラスタリングを考慮したモデルで評価される傾向があることを表している。
多くのアウトカムにおいて、ロジスティック回帰が第一選択肢であり、hospitalization or hospital stayと resource use or costsにおいて、線形回帰が一般的に使用されている。また、mortality、 physiological or clinical outcomes、treatment patternsを評価する場合には、Cox比例ハザード回帰が第二の選択肢として示されている。一方、Propensity score (PS)技術は交絡因子をグループ間でバランスさせることができることが証明されているが、既存の研究では広く使用されていない。
これらの調査結果に基づいて、異なるアウトカムを評価するための分析手法の方向性を表4に提案している。さらに、交絡因子の調整には、共変量調整とPS解析の2つの方法があるが、PS解析が従来の共変量調整よりも優れているとは限らないため、PS解析を慎重に選択することが提案されている。また、特定の病院で治療を受けた患者は、治療方針の違いから、他の病院で治療を受けた患者よりも似ている場合がある。このようなクラスター化したデータをモデル化するために、ランダム効果を持つマルチレベルモデルが、特定のクラスターにいる患者に対する予測因子効果を推定するために使用することが提案されている。
表4. 異なるアウトカムを測定するための統計的手法の提案
- 国内外のRWD研究の比較
さらに、本研究で得られた疾患領域に関する研究動向を、世界的な動向と大まかに比較した。その結果、ガンが世界的な研究トレンドである一方、感染症に関する研究では、日本特有のトレンドが見出された。
ビジネスにおける医療文献レビューの適用の広がり
- 日本以外の国におけるRWD研究を俯瞰すること
- RWD研究におけるプレイヤーのトレンド分析
- 新規RWD研究のデザインに特定な分析手法の方向性を提案すること
- デロイト トーマツが開発した医療エビデンス合成サービスRapid Medical Evidence Synthesisとの連携
まとめ
最近デロイトアナリティクスが発表した医療データベース疫学研究・メタ解析研究の論文調査研究を紹介した。この研究では、日本における医療クレームデータ、電子カルテ、と電子健康記録データを用いたRWD研究の論文を網羅的なレビューを通じて、頻繁に使用される研究デザイン、疾患領域、アウトカム、分析手法などの情報をクロス集計し、国内のRWD研究の現状とトレンドについて理解を提供している。調査結果からは、異なるアウトカムに対する特定の分析手法の方向性、日本特有の疾患領域のトレンド、既存研究における人工知能技術の使用の欠如などが明らかになった。また、国内外の関連研究との比較することで、日本特有の状況と課題を提言している。
参考文献
- Zhao Y, Tsubota T. The Current Status of Secondary Use of Claims, Electronic Medical Records, and Electronic Health Records in Epidemiology in Japan: Narrative Literature Review. JMIR Med Inform. 2023 Feb 14;11:e39876. doi: 10.2196/39876. PMID: 36787161; PMCID: PMC9975931.
執筆者プロフィール
趙 楊/Yang Zhao
デロイト トーマツ グループ
サービス内容等に関するお問い合わせは、下記のお問い合わせフォームにて受付いたします。お気軽にお問い合わせください。
その他の記事
ライフサイエンス・ヘルスケア業界向けアナリティクスサービス
業界知見を有するデータサイエンティストがアナリティクス導入を支援