お知らせ

デロイトアナリティクス毛利、大場が国際協力銀行(JBIC)と共著でSDGsが掲げるターゲット分析に関する論文を発表、奨励賞を受賞

10年分の新聞記事を用いて、SDGsが掲げるターゲットの話題性およびセクタ推移を明らかにしました

2021年8月26日に開催された第20回情報科学技術フォーラム(情報処理学会)で、有限責任監査法人トーマツ デロイトアナリティクス所属の毛利 研ならびに大場 久永が論文発表、奨励賞を受賞しました。

概要

1. はじめに
機械学習の技術が近年急速に発展したことにより、ビッグデータを利用したモデリングの信頼性が向上し、かつ容易になった。その結果、金融業界内でアルゴリズム取引の導入が進み、銘柄選択や投資比率の変更、新たな投資戦略の導入等によって追加的に得られるリターン生成(アルファ値)のための新たな情報源としてオルタナティブデータの利用が積極的に行われている。

オルタナティブデータとは、投資家によって投資判断のために使われるデータのうち、伝統的に用いられてきた決算開示を含む一般的な公開情報以外のデータを指す。例えば、ニュースの記事、SNSの投稿、POSデータ、クレジットカード決済情報、気象情報、人工衛星からの画像情報などがあり、従来投資判断に使うことが難しかったデータが、海外の金融機関を中心に利用が広まっている。その中でも、近年、持続可能な開発目標(SDGs:Sustainable Development Goals)に対する投資を加速させるために必要なデータなどの定義や提供が求められている。

2. 研究のアプローチ
本研究において過去約10年分の新聞記事コーパスデータを用いて、SDGsに対するオルタナティブデータ活用を検討するべく、自然言語処理を用いてSDGsが掲げるターゲットにおける話題性の時系列トレンドや注目するべきセクタの抽出を試みた。

経済の変動は経済指標や株価に代表されるように経済の変動はファンダメンタルズと投資家の投資行動における心理的な側面の両方が影響し、多数の市場参加者の膨大な情報が相互に作用しあって決定されるため、膨大な情報が相互に作用しあって決定される。非線形な挙動を示すため、数値情報の分析結果のみで長期的な投資判断を下す事は難しいとされている。その理由として、人間が解釈を行えないほど複雑な最適化が生じることや、数値以外の情報が欠落してしまっていることが挙げられる。そこで正しい用字用語で事象を的確に伝え、しかも裏付けのあるファクト(事実)を発信している新聞記事のテキストを用いて経済の変動を分析する研究が、自然言語処理技術の発達と共に近年盛んになってきている。

なお、テキストを用いる利点として解釈が容易であること、数値に含まれない情報も分析できることの2点が挙げられる。

SDGsが掲げるターゲットにおける話題性の時系列トレンドは、この取得した記事の特徴ベクトルとSDGsターゲットの特徴ベクトルのコサイン類似度を計算、類似度が高い記事の件数の推移を算出することで可視化した。

3. おわりに
SDGsに関する目標に紐づくターゲットの進行度の指標化、指標の時系列表示およびターゲットと最も類似する本文記事中の文の抽出ができた。一方で、扱う新聞記事データは、記者の取捨選択に伴っているため、本分析は今回利用した新聞に限定されてしまう可能性は否定できない。今後は、国内外の新聞記事のみならず有価証券報告書などを用いて海外から見たSDGs/ESGの潮流と企業の課題、企業イメージを具体化する必要がある。

テキストマイニング手法は、人間が処理できないほどの大量な新聞記事データから、効率的にトピックを抽出することが可能であることが分かった。一方で、企業動向の詳細を人間が俯瞰し、整理することで定性的なインサイトを獲得する必要がある。

自然言語処理の発展により、今まで対応できなかったスピード感で大量かつ粒度の細かい情報を処理することが出来るようになってきた。このように企業価値に占める無形資産、特にテキストデータの割合や重要性が近年高まってきており、それに伴い財務情報などからだけでは得られない情報をあらかじめセンシングする需要が高まっている。高度なアナリティクスを用いたパターン認識と機械学習は、従来人間が認識し得なかった要素をデータから意思決定に資する情報を的確に発見することが出来る。金融市場分析での機械と人間の当面の役割分担は、人間がまず関係のありそうなデータの範囲や目標を示し、そこから機械学習によるデータ解析を用いて有効なパターンの候補を機械に挙げてもらい、機械が提示した候補をどう評価して実際の投資に使うのかを人間が判断するというものになるであろう。さらに、過去データに無かったような新しいイベントや急激な変化が発生した場合の大局的な判断には,依然として人間の常識や直観による判断が求められると言える。

学会詳細

  • 名  称:第20回情報科学技術フォーラム(FIT2021)
  • 大会会期:2021年8月25日(水)~27日(金)
  • 会  場:オンライン開催
  • 主  催:一般社団法人電子情報通信学会、情報・システムソサイエティ(ISS)、ヒューマンコミュニケーショングループ(HCG)、一般社団法人情報処理学会(FIT2021幹事学会)
  • 共  催:東北学院大学

E-028 新聞コーパスを用いたSDGsが掲げるターゲットにおける話題性の時系列トレンド
毛利 研(有限責任監査法人トーマツ)・春日 剛(国際協力銀行)・大場 久永(有限責任監査法人トーマツ)・中原 えりか(国際協力銀行)

執筆者プロフィール

毛利 研 (もうり けん)
有限責任監査法人トーマツ デロイトアナリティクス
マネジャー

人工知能関連の実装能力、業務経験が豊富なだけでなく、機械学習/深層学習に掛かるアルゴリズムの研究開発、同テクノロジーを活用したビジネスモデルの企画、戦略策定、アナリティクス組織立ち上げを強みとする。特に、自然言語処理およびマーケティングオートメーション領域に関して多くの経験を有し、アナリティクス組織への高度化支援やデータ分析活動の助言、データサイエンスの教育事業に従事。

大場 久永
有限責任監査法人トーマツ デロイトアナリティクス
マネジャー

金融機関を主軸として、アナリティクスに関わるアドバイザリー業務に従事。信用リスクやAML領域、不正検知における機械学習及び深層学習の活用などを強みとする。また、サイバーセキュリティにおけるアナリティクス活用なども推進しており、金融機関における幅広い領域での業務経験を有する。

Deloitte Analyticsトップページへ戻る

サービス内容等に関するお問い合わせは、下記のお問い合わせフォームにて受付いたします。お気軽にお問い合わせください。

オンラインフォームより問い合わせを行う

お役に立ちましたか?