ナレッジ

医師間のつながり予測への応用:コミュニティナレッジグラフの抽象化

コミュニティナレッジグラフ(CKG)抽象化技術の、医師間のつながり予測に応用した事例について解説

ナレッジグラフ(KG)を活用したリンク予測の応用例として、医師の背景情報や学会参加データを用いて医師間のつながりを予測する手法が挙げられます。従来の機械学習手法では難しかった共通項目のない医師間のつながりも、デロイトアナリティクスとリバプール大学が共同開発したCKG抽象化技術により、ネットワーク構造を考慮して特定が可能です。この技術は、医師と薬剤間の親和性評価にも応用が期待されています。

背景

KGを活用したリンク予測のビジネス上の応用例として、医師の背景情報や学会の参加データを用いて、医師同士のつながりを予測する手法が挙げられます。従来の教師あり学習では、医師同士の共通情報(例:出身地が同じ、同じ学会への参加など)に基づいてつながりを予測することが可能ですが、共通項目を持たない二人の医師間のつながりを予測するのは難しいです。デロイトアナリティクスと英国リバプール大学が共同研究で開発した「コミュニティナレッジグラフの抽象化:リンク予測強化の新たなアプローチ」における一部の手法を活用することで、ネットワーク構造を考慮しながら医師間に潜在的なつながりを特定することが可能です。さらに、この技術を応用することで、医師と薬剤など、異なるデータ間の親和性を評価することも可能になります。

 

ナレッジグラフの設計

医師データの集計

実データから、KGに利用可能なエンティティと関係を抽出します。図1.Aに示すように、基本情報からは医師、施設、出身地、出身学校、出身医局といったエンティティを抽出します。また、講演会参加データからは、薬剤、学会名、参加情報(参加、座長、発表、ディスカッサー、ゲスト、司会など)の項目を抽出し、これらを医師の学会参加に関連するKGの構築に活用します。

医師情報を基にしたKGの設計

集計されたデータ項目による次のようなグラフ構造を設計します:
ノード:6種類のエンティティ(医師、都道府県、出身大学、施設、学会、薬剤)を表します。
エッジ:各種類のエンティティ間の関連は、図1.Bに示すように12種類を表します。原則として、同一種類のエンティティ間には関係が存在しません。

図1. 医師データからKGの設計へ

医師間のつながり予測

実際の医師の背景情報および講演会参加情報を基に、クライアントデータに特化した医師関連の知識グラフ(Physician Knowledge Graph:PhyKG)を構築し、既存のKnowledge Graph Embedding (KGE)手法によりベクトル化を行います。図2に示すワークフローと通り、提案したCKG抽象化技術の一部の手法を活用して医師間の距離を計算します。予測結果として、医師間のつながりは距離として表現され、距離が近いほどつながりが強いことを示します。

図2. 提案手法を活用した医師間のつながり予測

対象医師の距離ネットワークの可視化

予測結果をより直感的に観察するために、各ターゲット医師について、ターゲット医師と共通項目持ち・持たないをハイライトして表現した距離ネットワークを作成しました。図3は一つのターゲット医師の距離ネットワークの結果例です。この図では、ターゲット医師(緑色ノード)を中心に、予測された距離に基づいて距離ネットワークを構築しました。各ノードは医師を表し、医師情報も図1の例から次の発見が示されています:

  • 近接医師の特定: ターゲット医師と共通項目を持つ医師(黄色ノード)は、ターゲット医師に距離が近い傾向がわかります。これは、共通項目が医師間の関係性を強化し、相互の影響を示唆しています。一方、共通項目を持っていないかつターゲット医師より距離が近い医師は何人かの関連医師を経由して潜在的なつながりがあることを示し、POI(Physician of Interest)として提案します。
  • 遠方医師の特徴: ターゲット医師と共通項目を持たない医師(青色ノード)は、ターゲット医師から離れた位置に配置されており、予測された距離が長いことが確認できます。これは、共通項目が存在しない医師間では、関係性が弱まる可能性があることを示しています。
  • 共通項目の重要性: 共通項目の有無が医師間の距離に与える影響は、医療ネットワークの理解において重要な要素であることが示されています。特に、共通項目が多い医師間では、より密接な関係が構築される傾向があります。
  • 薬剤との親和性: 提案手法はPhyKGの構造を考慮した距離計算のため、医師エンティティと他のエンティティ(特に薬剤)間の親和性も評価可能です。このアプローチにより、特定の医師が好む薬剤や、相互に影響を与える医師と薬剤の関係性を明らかにすることが期待されます。

図3. ターゲット医師の距離ネットワーク結果例

従来の教師あり学習との比較

提案手法を用いることで、ネットワーク構造を考慮し、隠れた関係性を特定することが可能です。図2の例を用いることで、表1に示されるように、従来の教師あり学習では予測が難しい関係も、KGE法を活用して生成されたナレッジグラフ上で発見することが可能となります。この手法により、医師2を介した構造を通じて、医師1と医師3の間に潜在的なつながりが検出されました。同様に、医師1と医師4、医師5の間のつながりも明らかにされました。

表1. 提案手法と従来の教師あり学習によるネットワーク関係性検出の比較

まとめ

デロイトアナリティクスが発表したリンク予測を強化するためのCKGの抽象化技術の一部の手法を活用し、医師間のつながり予測への応用を取り上げました。この手法により、従来の機械学習では明らかにできない隠れた医師間の関係を洞察することが可能であることが示されました。さらに、医師と薬剤との親和性を評価することで、臨床や研究における新たな可能性を開拓します。我々が開発したCKG抽象化技術は、その柔軟性と汎用性が実証されており、他のドメインにおける構造化データにも効果的に適用可能です。そのため、今後さらに多様な領域での応用が期待されています。

 

参考文献

1. Zhao Y, Bollegala D, Hirose S, Jin Y, Kozu T. Community knowledge graph abstraction for enhanced link prediction: A study on PubMed knowledge graph. J Biomed Inform. 2024 Oct;158:104725. doi: 10.1016/j.jbi.2024.104725. Epub 2024 Sep 10. PMID: 39265815.

お役に立ちましたか?