in

データ文化を築き、AIプロジェクトを成功させる

文/Flow AI Blog 編集部

【要約】
1. AIプロジェクトを始める前に、まず正しいビジネス設定
2. モデルトレーニングを始める前に、まずデータパイプライン構築
3. 管理層とデータサイエンティストの協同体制

近年、多くの企業はAIの導入を考えるようになりました。しかし一口AIと言ってもその範囲は広く、チーム構築か技術のどちらを優先すべきか、企業はどのようにAIを現場に導入させるか、問題は山積みである。

FLOW AIはクラウドセキュリティの世界トップ3に入るトレンドマイクロ社の元ベテランITマネージャーであるチャールズ・チャン氏から、同社の成功事例を通じて、AIをビジネスに活かすための三大要素についてお話を伺いました。

ポイント①:ビジネス価値を発揮する鍵は正しい命題にあり

AIはいかに強力で注目を集めている技術ということは、もはや言うまでもないと思いますが、導入には高いコストがかかるため、企業としては正しい方法で適した用途に運用しなければ元も子もありません。

例えば原子力は、適切に使えば発電に利用できますが、使い方を誤れば非常に破壊力のある武器にもなり得ます。AI事業に言い換えますと、もしAI技術を適切に活用できなければ利益の創出どころが、かえって会社全体のコストアップになりかねません。

このような前提の中で、AI導入を成功させるために「Right Place」――つまり「正しい命題」を見つけ出すことこそが第一歩です。

では、「正しい命題」とは何か?これについては2つの面から考えられます: 

1. 十分なデータ量を備えているか(AIの訓練は大量なデータを機械学習モデルに与える必要があるため、データの不足はAIの成否に深く影響する)
2. 十分な利益を創出できるか(企業の限られているリソースに対してAI開発は非常にコストがかかるため、ハイリターンな弱点から着手する必要がある)

AI開発に大規模なチームは必要なのか?マイクロソフト リサーチアジア(MSRA)が東方海外貨櫃航運(OOCL)と提携開発した海運最適化AIプロジェクトを例として挙げましょう。

チームは僅か10人足らずでしたが、AIで解決するのに最適な問題を特定し利益を7%向上させたのみならず、年間1千万ドルのコスト削減も実現させました。

この例から、正しい命題のもとに利益を創出することがいかに重要なのかがお分かりいただけると思います。

「正しい命題」を見つけたら、次に考えるべきはAIを「決断する側」それとも「サポートする側」どちらに位置づけるかという問題になります。「取捨選択」はAI導入の仕方について検討する際の鍵であり、2つのポイントから判断することができます: 

1. もしAIが誤作動をしたら、それは容認できる範囲なのか?
2. 容認できるかは別として、良好なモニタリング機能と安全装置は必要である。

AIシステムの判断ミスの一例として、ボーイング737 MAXの墜落事故があります。飛行中にAIとパイロットの判断が対立し合った上に、システムにしっかりとした安全保障機能が組み込まれていませんでした。その結果、悲劇が起ったのです。AIを導入する際のモニタリング機能と安全装置の重要さがよくわかる事例です。

ポイント②:AI開発の前工程はデータパイプラインの構築

AIで解決する必要のある運用シーンは、おおよそ「変動しないもの」と「変動するもの」の2種類に分けられます。例えば特定のシーンに対しての画像認識は「変動しないもの」であり、金融やウィルス予防モデルは実際の状況に応じて「変動するもの」となります。

さまざまな問題に応じて、企業は独自のアプローチで自前にデータパイプラインを構築して行きます。

「変動しない」問題に関しては、十分なデータがあれば対応するのは比較的に簡単です。

一方、「変動する」問題となると継続的にデータを収集・更新し、集めたデータの属性や需要に基づいてデータパイプラインを構築する必要があります。

そのため、まずデータを用意し、データパイプラインを構築する準備ができていなければ、AIプロジェクトに取り掛かるのは現実的ではないと言えます。

 (画像出典:トレンドマイクロ株式会社)

AIプロジェクトのデータパイプラインにおいて、アルゴリズムが占める割合は実はごく一部(上図の黒いブロック)に過ぎず、残りの部分を構築するためにはデータエンジニアやデータインフラエンジニアの手も借りなければなりません。

高品質なデータを得るためには良好なデータパイプラインの確立はもちろん、信用できるデータラベリングも同じくらい重要です。

例えばAmazon社が提供するウェブサービスのM-Turkでは、クラウドソーシングの概念に基づき、簡単なラベリング作業をしてくれる「Ground Truth」というサービスがありますが、それに対してFlow AIは専門のラベリングチームに任せています。どちらかが優れているというわけではなく、それぞれに特徴があり、ニーズやリソースの配分に応じて使い分けるのがベストでしょう。

ポイント③:企業文化と共通言語の実践でシナジー効果を狙う

AIプロジェクトを進めて行くうちに、企業が往々にして遭遇する課題は2つあります。

まず1つ目は、特定分野の専門家(ドメインエキスパート)とデータサイエンティストの連携です。

例えば、ある問題に対し、専門家は既存の対応策を好むが、データサイエンティストはデータで解決すべきだと考え、その分野について詳しく学ぼうとしない場合もあります。

しかしAIプロジェクトにおいて「機械学習モデルのデバッグ」が重要であり、産業とデータの専門家両方の知識・スキルを合わせることは必要不可欠です。プロジェクトを成功させたいのであれば、この2つの役割は知識を共有し連携していく必要があります。

 (画像出典:トレンドマイクロ株式会社)

2つ目の課題は、管理者とデータサイエンティストの連携です。

仮にあるデータサイエンティストが18ヶ月の間AIプロジェクトに取り組んでいた場合、管理者の立場からすると「なぜ長らく成果を出せていないのか」と疑問に思うでしょう。管理者は問題の解決策はおろか原因の特定もままならず、データサイエンティストが説明するも、それを理解できるほどの専門知識を持ち合わせていない可能性があります。そうすると、プロジェクトの方向性も対応策も漠然としたものになってしまいます。

上述の課題を踏まえて、我々はAIは『専門家に取って代わるものではなく、その能力を十分に発揮できるようサポートするものだ』と強調したい。大事なのは「Actionable Intelligence(判断基準となる情報)」を活用し、行き詰まった時は専門知識とデータのどちらに頼るかを判断することです。

囲碁AIとして知られている「AlphaGo」の成功も、Google DeepMindチームに在籍するコンピュータ囲碁の専門家でありデータサイエンティストでもある黃士傑(アジャ・ファン)博士の多分野にまたがる専門知識があってこそ、短期間で凄まじい進化を遂げることができたと言えます。

そもそもAIと機械学習は決して万能ではなく、適切に運用して初めてその価値を発揮するものです。それを活かすためには、管理者、データサイエンティスト、専門家の三方を繋ぐビジネス知識と、ビッグデータ知識の共通言語化が必要となります。そして利益を最大化するために、常にトレードオフの判断を厭わないことも大切です。

プロジェクト成功の秘訣:チームが先、技術はその後

まとめると、AIプロジェクトを成功させるために大切なのは、まず正しい命題を見つけ、その上で優れたチームを編成することです。そしてチームの構成員には管理者、プロダクトマネージャー、各分野の専門家、データインフラエンジニア、データサイエンティストなどが必要で、継続可能なデータパイプラインを構築し、データの本質を見抜く力も高めなければなりません。

優先順位を命題、データ収集、技術問題だと勘違いする方も多いと思いますが、我々の経験上、AI導入にはどんな技術、どんなデータを使うかは二の次で、AIプロジェクトの推進において最も大事なファクターは、チーム内の「データ文化」を確立させることです。これをやるかやらないかでは成功率に強く影響します。

最後に「人材」と「企業文化」も重要なポイントです。「人材」というのは優れた才能の持ち主を見つけることではなく、企業全体がデータに関する文化、経験と知識を有してこそ、AIプロジェクトの成功と最大利益の創出に繋がります。

関連記事
複雑なデータアノテーションの対処法とは?
精確なアノテーションはゴールの設定から始まる


複雑なデータアノテーションの対処法とは?

精確なアノテーションはゴールの設定から始まる