最新動向/市場予測

Artificial intelligence(AI)

TMT Predictions 2019

グローバル版: 利用の「民主化」が進む

・日本版抄訳(日本語)

 右記ダウンロードボタンよりファイル取得

・本文全編リンク(英語)

 Artificial intelligence: From expert-only to everywhere

 

 

日本の視点:日本におけるAIの「民主化」

AIが身近に検証できる世界

日本において昨年くらいから、CMや家電量販店で見ない日はないというくらいに認知されつつあるスマートスピーカー。例えばこのスマートスピーカーを利用して、音声で会議のインビテーションを送付するような仕組みを作る、となるとどのくらいの期間と工数がかかるものなのだろうか?
仕組みは「スマートスピーカーで音声から要件を聞き取り」、あとは「ロジックでスケジュール管理システムの予定を抑えにいく」という部分をそれぞれ作り、連携させるというシンプルなもので良いとする。だがこれを実際に作ろうとすると、「音声認識→言語解析→システムに問い合わせ→返信受領→音声回答→音声認識」などなど、とシンプルなプロセスの割にはAI的な要素が必要な部分が非常に多くあることがわかる。これを作るのに、果たしてどの程度の時間がかかるだろうか?
実は筆者はこの仕組みを構築したことがある。最初のパイロット版を構築するのにかかった期間はわずか1週間ほどだった。というのも、上記であげたAI的要素はすべて、クラウド上で公開されているAIのプラットフォームやツールを利用したからだ。認識・音声の回答、日本語の理解など、一から作れば膨大な工数になるものを、公開されている仕組みを組み合わせることで大幅に縮小することができた。低コストでAIの活用の可能性が試行できたと自負している。
実際、グローバルの有力なベンダーやソフトハウスが、クラウド上にAIの実行環境やアプリケーションを、プラットフォームやAPIという形式でリリースしている。下記に簡単な表としてまとめてみた(図表1)。各社はおおよそ同じような領域の実行環境やアプリケーションを公開している。

図表1 メジャーなクラウドAI系のサービス

*2018年8月に使用停止され、Azure Machine Learning Studio のテキスト分析モジュールに移行1

出所:各社ウェブサイトを基にデロイト トーマツ コンサルティング合同会社作成(2019年2月)。最新の情報は各社ウェブサイトを参照

 

国内企業も負けておらず、リクルートテクノロジーズやNTTドコモなどもAI系のAPIを公開している2。またこうしたビッグネームに限らず、クラウド上で自社のAIサービスを展開する動きはスタートアップ系の企業においても盛んになっている。例えば「手書き」や「ファックス等でつぶれてしまった」紙情報を、AI技術を利用したOCRサービスで電子化を実現させるようなサービス“Tegaki”を提供しているCogent Labs社3や異なるSNS Messenger同士や母国語同士の利用者をつなげるAI補助型コミュニケーションプラットフォーム”Kotozna chat”を提供しているKotozna社4などがあげられる。

このような動きは日本の法人におけるAIの利用拡大につながっていくと考えられる。というのはまっさらな状態から「AIを使えるようにする」のが非常に難しいからだ。この「使えるようにする」というのは環境構築と学習の大きく二つのステップに分けられる。

AI系の技術はこれまで学術機関、研究機関、軍事機関あるいはオープンソース系のエバンジェリストたちが中心になって発展してきたと言える。筆者は数年前に実際これらの基礎資料等を読もうと試みたが、数式と統計用語がびっしり羅列されており、これらをどのようにビジネスシーンにて活用するのか全く見当がつかなかった。

資料では埒が明かず、実際に最初のステップとして環境構築を試みたが、やはり簡単には行かなかった。一般的なオフィスアプリケーションであれば、ワンクリックで本体のプログラム以外に依存関係にあるプログラムも合わせてインストールされるインストーラーが配布される。しかしAI系のアプリケーションにはそのような便利なものが用意されていることのほうが少ない。依存関係にあるプログラムは、自分で正しいものを発見し、都度インストールする必要がある。運が悪い時は依存関係にあるプログラムのさらにその先にも依存するプログラムが存在し、なかなか本体のインストールに辿り着けない。

こうして、動かすための環境を構築するだけで時間と労力、リソースを使い、認知系の機能を学習しソリューション開発になかなか至れなかった、というのが正直な感想だ。こうした経験から考えるとAIの実行環境やアプリケーションがクラウド化されて、思い立ったらすぐに利用可能になるということは非常に大きな意味がある。

また次のステップである学習も、環境構築と同じように時間と労力を必要とする。近年の「AI」と呼ばれているものは、自律的に何かを学んで進化していく要素は少なく、ほとんどが定義された大量のトレーニングデータを読み込んで学習していく「認知=Cognitive」なものが多い。そのため環境構築が終わった直後のアプリケーションは文字通り「生まれたての赤ん坊」だ。

例えば構築したての画像認識のアプリケーションに"リンゴ"や"数字の1"の画像を処理させても妥当な答えは返ってこない。確かに生まれたての人間の赤ん坊にリンゴを見せても、「これはリンゴだ」と分からず、誰かが「これは”リンゴ”だ」と教えたり、自分で見たり触ったり食べたりして「リンゴは赤くて丸くて食べられるものだ」という知識が蓄積されていき、リンゴというものを自分で認識できるようになる。

現在の認知系のAIでも同じことで、リンゴというものを教えていく必要がある。その際リンゴの画像を一枚だけ見せて、世の中すべてのリンゴの画像が認識できるわけではなく、それなりの数のリンゴの画像やリンゴ以外の「赤い丸いもの」の画像を見せ、その違いも教えることで、ランダムな画像の中から「リンゴ」というものを認識できるAIのアプリケーションができあがる。この作業もまた途方のない工数を必要とする。

しかしながらクラウドのAIアプリケーションには事前に学習済みのデータが用意されていることが多い。例えば、前述したリクルートテクノロジーズが提供するProof ReadingというAPIツールは、求人系の文章を学習データに使い、不自然な日本語を検知する5

このように、画像認識を例にあげると日常生活に身近な物体や文字、数字が認識できるような情報が用意されている。ただし、クラウド上でサービスとして展開し幅広く使えるようにしている以上、学習済みのデータはある程度汎用的になり、かゆいところに手が届かず結果的に使えないという懸念もある。

とはいえ用途を特化したものを用意したりしているベンダーも出てきている。例えば言語処理であれば、技術的なニュースや法律文書(契約書)の理解に特化した学習済みのデータが用意されるようなケースがある。このように、学習済みデータはこうした懸念も軽減されつつあり、永続的に事前学習済みデータを使うのがよいかどうかは議論の余地はあるものの、試行や検討の段階で利用するには十分なレベルだと考えられる。

日本でAIの民主化は爆発的に進むか

では、クラウド上のAIが増えていくことで、日本の企業でもAIの利用が爆発的に増えるか、というと必ずしもそうは言い切れない。その理由には「日本語」、「実用性」、「データガバナンス」の三つのキーワードがあげられる。

まずは「日本語」について見ていきたい。「日本語」は文法も意味も非常に揺らぎのある言葉で、AIに学習させるのが難しい。例えば自然な「日本語」の文章で主語や述語が「省略」されることは決して珍しいものではない。そのため一つの文章を単語に分割しても、何が主語で、何が述語なのかをその中から特定することができない。もちろん前後の文脈から読み解くことは可能だが、主語と述語を明確にする英語圏で育まれてきた認知系の技術で対応することが難しいとされる。ほかにもAIが理解するのが難しい日本語の特徴に、受験生に「落ちる」、「滑る」といった言葉は絶対使ってはいけないといった「言霊信仰」的な側面や、「和歌」によく見られるような言葉の繋げ方で作り出す「音」で書かれている記号とは別な意味を持たせるといった「芸術的」な側面があげられる。さらには「そうですねぇ」といった「Yes」にも「No」にもどちらにも明確にとることができない相槌表現の認識も相当難しいものであろう。

実際にSiriやAlexa、Google HomeなどのスマートスピーカーやPepperなどの音声を理解するデバイスに、無意識に不自然なほど丁寧な日本語で話しかけた経験はないだろうか?当面はこの不自然な日本語が必要になると考えておいたほうがよいだろう。

次に「実用性」についてだ。現在のAIの主流である認知系の技術は確率と統計に基づくアプローチをとっており、強いて言うなら、与えられたインプットの特徴が過去に蓄積されたデータの特徴と比較して一番近いものと同じであると類推し、「このインプットは〇〇である確率が90%だ」というアウトプットを出す。このアプローチでは、どこまでいっても完璧な判断にはならず、またその過程でどの部分を特徴として捉えてどのような加重平均で、そのレーティングを出しているかはブラックボックスになっており、答えを導き出した方法を論理的に説明することができない。

認知系技術を使わずにプログラミングのロジックで時間をかけて細かくパターン分けして実装すれば正答率はあがるが、認知系技術における学習やトレーニング用のデータの収集に時間をかけても、思ったよりも正答率が伸びないということがよくある。

AIの民主化により、手軽に機能が使えるようになるのは間違いないが、トレーニング用のデータは多ければ多いほうがいいといった単純な発想で、人間でも判定に困るデータや、間違った判定をしているデータなどもまとめて投入してしまう運用では、期待している正答率の実現は不可能だろう。こうした結果になってしまうとせっかく導入したAIのアプリケーションを凍結したり、その前後にロジックベースで判断を出すアプリケーションを開発したり、というケースも多く出てくるだろう。

こうした中で必要になるのが、本編にあるデータサイエンティストの役割だ。単に統計オタクとしてではなく、業務的にやりたいこと・解決したい課題を見据えてそこに必要なデータにあたりをつけ、実際にエンジニアリングもできるようなリソースの確保は必須になるだろう。米国などでデータサイエンティストの雇用ニーズは今後も大きいと予測されている6。これは日本も同じ状況だと考えられるが、残念ながら現時点での日本におけるデータサイエンティストに対する明確に定義されたスキルセット、保有資格が無いことも相まって、即戦力となる人材がニーズを満たすほど人材市場に出てきていない。データサイエンティストの育成に目を付け始めている機関はあるが、AIの民主化に比べると動きが遅く、データサイエンティスト不足が、日本企業のAIの効率的な利用のボトルネックになる可能性は高い。

最後の関門が「データガバナンス」だ。このトピックに移る前に、AIを企業が利用するうえで考慮にいれるべき視点がひとつある。2018年12月に内閣府が「人間中心のAI社会原則検討会議」を通してAIの7つの原則案を取りまとめ、公表した。その中の一つに、「企業が意思決定の過程にAIを利用した場合、その説明責任を問われる」というものがある7。例えば企業が採用の絞り込みにAIを利用した場合、そのAIによる判断基準が曖昧であっては意味がない。あるいは企業側が把握していないところで、AIが性別や宗教、出身地などで判断することがあり得るし、かつその状況すらも把握できない可能性もある。そういった懸念を取り除く一つの要素として、企業に決定理由を分かりやすく伝える責務を負わせ、最終的には人がAIの判断に関する責任を持つことで、AIの普及を促す、というのがこの原則の狙いに含まれている。企業側としてはAIを利用する意欲が削がれるかもしれないが、ここで自分たちを守り、適正なAI利用につなげる要素の一つとして「データガバナンス」がある。

すでに触れてきたように今のAIの大半を占める認知系の技術には統計の要素が多くあり、そのため学習やトレーニングに使うデータの“質”が非常に重要になる。企業がAIのインプットとして準備できるデータの質が悪ければ、どんなに素晴らしいデータサイエンティストを雇用しようがAIは最適解をもたらさない。またそもそも自社がどういう情報を持っているか正確に把握できないと、AIに何をやらせるか、という構想策定そのものが難しい可能性もある。

こうした理由でAI活用の前提には、データを企業の付加価値を生む要素にするため、知的財産のように企業資産として守っていこう、という「データガバナンス」の考え方が必要になる。一般的な企業であれば顧客、取引先、製品に関した膨大な量のデータを保持しているはずだが、ただこのようなデータのすべてに対して自信をもって「正しい状態」で格納している企業はどのくらいあるだろうか。ここでいう「正しい状態」とは「最新」で「正確」で「改ざん」されておらず、適切な「アクセス管理・セキュリティ管理」がされている状態である。

例えば自社の営業部の共有フォルダに同じ名前の「引き合いリスト」なるファイルがいくつかあるか、どれが一番漏れなく正しく更新されているか、すぐに答えられるだろうか?悪意のある同僚に書き換えられていないと言い切れるだろうか?また自分の部署は、隣の部署が出す報告書と同じ項目を持ち、内容の一貫性が取れているだろうか?

また本項目の冒頭でも触れた「企業の説明責任」を問われたときにAIの判断のインプットとなるデータの“質”を保つことも自分たちの身を守るうえで非常に重要なファクトになる。ただガムシャラに今ある情報をAIに学習させている状況とは全然違うからである。

このように、日本の企業も「データガバナンス」を強化していくことが必須となるだろう。AIの民主化の波に乗り遅れないように、AIの活用を見据えてデータを資産として棚卸し、適格に管理するところから早急に始める必要がある。

「全部AI」ではなく、「少しAI」から始める次の一歩

さてここまで本編に対して、客観的な見解を述べてきたが、新しい技術はできる限り使っていく必要がある。ただし前述した課題は一日で根本的に解決するものではない。それゆえ、ビッグバンで大規模にAIを導入するのではなく、小さく過度な期待をせずに既存のサービスやシステムに組み合わせる形で導入していくアプローチで民主化の波を乗りこなす、という進め方を最後に提言しておきたい。

冒頭で紹介したように、筆者がスマートスピーカーを利用した会議予約の仕組みを構築した際には、クラウド上で利用可能になっている技術を組み合わせることで低コストかつスピーディーなAIの活用の可能性が試行できた。またこれ以外にも多数のプロジェクトを運営する業態の企業で、各プロジェクトのマネジャーが月次で報告してくる資料について、ロジックと機械学習を組み合わせて人間に近い一時判断を提供するソリューションを構築した。この際も工数を最小限にするためにクラウド上の機械学習のプラットフォームを用いることで環境構築にかかる時間とリソースを圧縮させ、ロジック部分の実装とトレーニングに集中できた。

両ケースとも「全部をAIにやらせようとはしない」ことを重点として意識している。前者では予約時間を抽出し、会議情報を作成するところはロジックで実装している。また後者では、ロジックを用いて明らかに情報が不足していたり、数値に矛盾があるものを判定し、ロジックでは評価できない定性的なコメントを中心とした箇所のみ機械学習で判定する構成にすることで、一定の精度を維持するような仕掛けを実現できた。実際にユーザーからは、コメントをすべてチェックせずにAIが問題だと判定したものだけを見ることで、業務負荷が減ったという評価を得られた。

このようにAIに判断させる箇所を最適化することで、先に挙げたリスクや課題の影響を最小化するアプローチで導入するのが、当面の最適解だと考えられる。

上述の通り、クラウド上のAI環境が多く出てきて、手軽にAIが利用できる機会は目の前にある。ただその中でもAIという言葉に踊らされず、できるところから小さく導入しながら、「日本語」、「実用性」、そして「データガバナンス」といった課題をトライ&エラーを繰り返すことで少しずつ消化していき、AIの領域を徐々に拡張していくアプローチで、AIの民主化の波をうまく乗りこなしていくことは可能になるだろう。AIは決して万能薬ではないが、うまく使いこなすことで新たな価値を創造できるはずだ。

 

筆者

中村 吉信 Nakamura, Yoshinobu
デロイト トーマツ コンサルティング合同会社
執行役員
大手外資系コンサルティング会社にて業務戦略立案、経営管理、PMI、SSC/BPO、業務改革、システム導入の経験を有する。現在は、Business Model & Finance TransformationにおいてRobotics & Cognitive Innovationの責任者を担当。

阿部 貴裕 Abe, Takahiro
デロイト トーマツ コンサルティング合同会社
マネジャー
ITベンチャー企業、国内コンサルティング会社を経て、デロイト トーマツ コンサルティングに入社。Windows MobileによるFX取引システムから会計系システムの構築まで多種多様なシステムを手掛ける。近年は先端技術領域を積極的に取り入れたソリューションを展開している。

 

【参考資料】

1. Linguistic Analysis プレビュー, Microsoft Azure, 2018/2/25:https://azure.microsoft.com/ja-jp/services/cognitive-services/linguistic-analysis-api/
2. “A3RT(アート)”, リクルートテクノロジーズ:https://a3rt.recruit-tech.co.jp/
3. “Tegaki”, Cogent Labs:https://www.tegaki.ai/
4. “Kotozna”, Kotozna株式会社:http://kotozna.com/chat/
5. “Proofreading API”, リクルートテクノロジーズ: https://a3rt.recruit-tech.co.jp/product/proofreadingAPI/
6. The Quant Crunch How the Demand for Data Science Skills is Disrupting the Job Market, Burning Glass Technologies, 2017:https://www-01.ibm.com/common/ssi/cgi-bin/ssialias?htmlfid=IML14576USEN
7. 人間中心のAI社会原則検討会議 人間中心の AI 社会原則(案), 内閣府, 2018/12/27:https://www8.cao.go.jp/cstp/tyousakai/humanai/ai_gensoku.pdf

お役に立ちましたか?