Posted: 18 Dec. 2022 3 min. read

MLOps ―AIの工業的な活用―

AIの利活用が進む中、デロイト トーマツの調査によるとPoCや開発のフェーズまで実施できている企業に比して、その後の運用まで進んでいる企業が多くありません。その原因はどこにあるのでしょうか。

 

機械学習、AI(Artificial Intelligence)を取りまく我々の現状

昨今、機械学習などをはじめとした弱いAI(以下AI)が普及し始めており、画像認識や自然言語処理、需要予測など様々な分野で日々活躍しています。

機械学習をはじめとしたAIに関しては、①単純で②法則があるような分野では特に力を発揮することができます。デロイト トーマツの「AIガバナンス サーベイ2019」の調査結果によると、日本企業では全体の半数以上がAIの利活用を開始しているものの、その半数以上がPoC(Proof of Concept:概念実証)まで到達できていないことが見受けられます。そしてPoCまで進んでいても、AIの運用までのサイクルをうまく回せていないケースが多く存在します。下図の通り、本番運用の実施まで到達している企業は全体の19%、さらにビジネスを達成したと回答した企業はわずか16%となっています。

 

※クリックまたはタップして拡大表示できます

なぜPoCや開発のフェーズまでは実施できている会社の数に対して、その後の運用まで実施できている会社が少ないのでしょうか。デロイト トーマツの調査/経験による2つの例から考察してみましょう。

例1.大手製薬会社の場合

ある大手製薬会社ではデータサイエンスの部門を持っており、既存の製品の販売に関して機械学習モデルを適用してその効果を確認していましたが、機械学習モデルの製造・運用プロセスを異なる製品へ拡張できませんでした。この原因としては、機械学習モデルを開発フェーズから本番化し、運用フェーズへ移行するにはその間に大きなギャップがあり、「そのギャップを埋めるためのシステム化や本番運用する体制・人材が準備できない」ということが判明しました。

例2.ヘルスケア業界の複合組織の場合

この会社では新型コロナウイルス感染症のパンデミックの状況で、これまでの学習データとは大きく傾向が変わってしまった故に、複数の機械学習モデルにおいて予測性能が急速に劣化していることを確認しました。そこで彼らはデロイト トーマツの支援のもと、モデルの再構築のみならず、End-to-Endでの機械学習モデルのライフサイクルをカバーできるプロセスも整備しました。さらに、堅牢なモデル運用のサポート体制作りにも力を入れました。

上述の例からAIの本番化に関して、うまく進められてない理由を列挙することができますが、①データサイエンティストとエンジニアをつなぐ人材が不足していること。②運用側にデータサイエンティストの関与が足りないこと。の2点が大きい阻害要因だと認識されています。

① データサイエンティストとエンジニアをつなぐ人材が不足している

開発から運用までのプロセスでは、通常データサイエンティストが機械学習モデルを設計し、アドホックな開発を通してモデルの精度を高めていきます。開発者(データサイエンティスト)が、特にクラウド環境でモデルのデプロイを行うとき、純粋な機械学習や、AIの知識以外に運用の知識(例えばAWSにおいて、デプロイする際のデータ処理パイプラインをどう構築すべきか、など)を相対的に求められることになります。逆にインフラエンジニアは社内のITガバナンスのもと、システムの運用管理仕組みについては熟知していると考えられます。しかし、機械学習モデルをどのようにモニタリングすれば良いか、について熟知していることは少ないと予想されます。互いの分野をオーバーラップするような関係が理想的ではありますが、インフラ系統の知識とデータサイエンスの知識は、離れているため難しく、両者の間を埋めることが課題となっています。

② 運用側にデータサイエンティストの関与が足りない

完全に説明可能なAIが完成されるまではF値などの指標を鑑みて、いつ再学習を行うか、などを選択するのはデータサイエンティストの領域であると言えるでしょう。しかし、データサイエンティストに依頼をしようとしても、開発環境と運用環境が異なるために(もしくは、開発から運用までの統一されたプロセスがないために)、特にデータサイエンティストが絡む領域において、改善を含めた運用がうまく回らないという現状があります。

主に上記2つの理由から、開発・運用のサイクルがうまく回らず、機械学習モデルのスケールがAI利活用の最も大きな阻害要因になっています。 

このような現状の課題(つまり開発から運用サイクルの淀みないサイクルの創造・プロセス化)を解決する1つの指針がMLOpsです。

 

■ MLOpsとは

MLOpsとは、Machine Learning Operationsを略したAI利活用におけるキーワードです。DevOpsとは、環境/アプリケーションの開発~運用の流れを別々の担当者が行うのではなく、一貫して管理することができるようになる、という概念でした。

これを踏まえると、MLOpsとは、モデルの開発〜運用の流れを別々の担当者(ここではデータサイエンティストとインフラエンジニアなど)が担当することなく、一貫して運用管理ができることを指します。いわばDevOpsの機械学習(Machine Learning)版となっています。

 

次回では、MLOpsを実現するための要点や、実現するために必要な環境/体制の整備について、議論します。

 

執筆者

Jin Rongsheng
デロイト トーマツ コンサルティング スペシャリストリード

中国の大学でソフトウェアエンジニアリング専攻を卒業し、日本にわたり10年以上のシステム開発に従事。フルスタックエンジニアとして、オープンソースから商用クラウドを活用してWebサービス、アプリ、会計システム等をフロントエンドからバックエンドまで設計開発、運用を経験。データサイエンティストとして、会員事業、コマース事業、広告事業向けの機械学習モデルの構築を手掛けた実績がある。デロイト トーマツではRPA、チャットボット、データ分析基盤、DataRobot、広告効果検証基盤、BI分析基盤、クラウド移行、データサイエンティスト支援等領域でプロジェクトを担当。技術とコンサルティングの両立を目指して日々取り組んでいる。

青木 太一
デロイト トーマツ コンサルティング コンサルタント

AI & DataにてRPAを用いた業務設計及び、構築、導入を経験。現在はDeloitte dx Garageにて、自社のインフラ環境のグローバルアラインの検討及び、展開支援を行いつつ、AI&Data AI Insights & Engagementにて、MLOpsを活用したサービス企画(ML-O2)及びプロモーション活動に従事している。 AI、ブロックチェーン、RPAなどテクノロジー領域とコンサルティングを組み合わせた専門性の高い人材を目指して、日々研鑽を積んでいる。