in

100件以上のAIプロジェクト実績!台湾で最も信頼されるデータ処理プラットフォームの誕生秘話

文/ Flow AI Blog編集部

自社のプラットフォームをどんなふうに説明しますか?とFLOW AIデータサービス事業部のプロダクト・マネージャーである沈柏均(シェン・ボウジン)に訊ねてみると、彼はまるで考えるまでもないような朗らかな声で「“幸せ”で出来ているプラットフォーム」と答えました。

データやモデルなどを語るAI業界では、「幸せ」という言葉が出てくるのに違和感を覚える方もいらっしゃるかもしれませんが、彼にはちゃんとした理由があります。

「この世で最もデータアノテーションを嫌っているのは、おそらくエンジニアだろう」と彼は冗談をまじりながら話しました。

情報工学出身で学界から発足し、業界に進出した沈氏はアノテーションツールの開発に長けており、ユーザー行為やそのつまずきについて研究し続けてきました。

彼の観察によると、最近は多くの大手企業から無料のアノテーションツールが公開されていますが、そのほとんどは最低限のものでしかなくて、プロジェクトの要件定義が少しでも変わるとエンジニア自らツールの調整をしなければなりません。また、特定のプロジェクトのためにわざわざ専用インターフェースをデザインするわけにもいかず、作業時間が引き伸ばされると必然的にアノテーターの集中力が途切れ、生産性やクオリティーが低下し、トレーニングの結果にも影響を与えてしまいます。

FLOW AIのプラットフォームは、IT技術の力を活かしてアノテーターの仕事をサポートしながら、誰もがリアルタイムでデータの流れを確認できることに念頭を置いて開発しました」と沈氏は自信満々に話しました。


人間中心設計のプラットフォーム

FLOW AIのアノテーションプラットフォームは、全体的に2つの部分によって構成されています。

1、各種スマートツールと自動ラベリング機能
2、データ管理、プロジェクト管理や教育訓練などを網羅したデータサービスシステム

現在、弊社のプラットフォームには、アノテーション作業を輔助する様々なスマートツールが用意されています。中にはバウンディングボックスやポリライン、カテゴリ、キーポイント…など、それぞれ異なる業種のAIプロジェクトに対応するための必須ツールです。

沈柏均とそのチームには、2つの目標を持っています。

それは、品質と効率の追求と、ユーザーのために“幸せ”を創出することです。

「例えばポリゴンとピクセルワイズ法だと、今は二次元画像のラベリングならば点を4つ打つだけでオブジェクトを切り出せるので、効率は少なくとも5倍になっていて精度も昔と比べて大幅に向上しました」と、沈氏はプラットフォームに搭載されているツールについて詳しく説明しました。

弊社の経験上、教師データの品質と歩留まりの改善は、アノテーターからのフィードバックに強く関係しています。例えばキーポイントのツールでラベリングをする際、公開されているアノテーションツールは一般的に点ごとにタグをつける必要のある仕様ですが、これだと非常に時間と手間がかかります。

(関連記事:ソーシャルワークX人工知能、「FLOW AI」から生まれた新時代の障害者雇用とは

アノテーターからの意見を参考して、開発チームは点を打つと同時にタグも自動的につけられるようにツールを組み換えました。これに関して、沈氏は「取るに足らないほどの変化ではありますが、日々最適化を続けることでやがて大きな時間の節約に繋がります」と言いました。

そのほか、弊社がプロジェクト管理から得られた経験も、アノテーションツールの開発に取り入れられています。

弊社は今まで自動運転車をはじめ、橋梁の安全点検や欠陥検出、eコマース、スマート農業、スマート医療などの分野を跨り、100件以上のプロジェクトに携わってきました。エンジニアたちは各プロジェクトの担当マネージャーから知見を集め、例えばルールが不明確の場合や、アノテーターに誤解を与えやすく作業の妨げになりそうな場合、ツールが事前に修正の方向性についてアドバイスを提示したり、オンラインで即時作業成果を検証することもできるようにと改良を重ね続けています。


データの流れを読み取ろう

アノテーターにとってこのプラットフォームは作業の場であると同時に、「作業履歴を記録する場所」でもあります。

弊社のAIデータサービスプラットフォームでは、各アノテーターの得意不得意と実績を逐一記録しており、適切な人材を適したプロジェクトに配置し身体的ハンディキャップの影響を最低限に抑えています。運用チームもプラットフォームを通してアノテーターの作業状況を引き続き追跡し、タイムリーな励ましの言葉や教育訓練を提供することも可能です。

お客様にとって、このプラットフォームは「フィードバックを得られる場所」です。

沈柏均氏の分析によりますと、ハードウェアとモデル、そしてデータこそAIを支える「三本の柱」。近年、Nvidia社をはじめとする大手メーカーのおかげで、ハードウェア技術は目まぐるしい進歩を遂げました。これに伴いAI産業も破竹の勢いで発展していて、となるとこれから大事になるのは、

「所有しているデータの量と独自性が勝敗を決めるでしょう」と、沈氏は考察しました。

そのため、お客様により迅速かつ良質なアノテーションサービスをお届けするために、FLOW AIは次なるステップに進もうとしています。

お客様からいただいたデータは分類/データクリーニングとアノテーションの工程を経て(上画像参照)、更にアルゴリズムによる分析と抽出を行うことで各バッチのデータのクオリティーとモデルとの交互作用がわかります。例えばスマートシティのシーンだと、映像のコントラスト、明るさと暗さ、そして後続のデータ収集の方向性なども分析することで、AIプロジェクト全体の高速化を図ります。

沈柏均氏が今進めているのは、IT技術の力を借りて「世界で唯一の“幸せ”により構築された高効率のデータ戦略プラットフォーム」を実現することです。お客様とFLOWのAIチーム、そしてアノテーターたちがAI産業という広いフィールドで助け合い、テクノロジーを使ってお互いにとっての利益を生み出すことこそ、沈氏の目指している未来図です。


【関連記事】

変化の激しいAI産業で、お客様のニーズに確実に応える方法とは? FLOW AIのプロジェクトマネジメント部門の経験談をご参考ください。
➡️➡️ AIプロジェクトの管理はどんな感じ?PDCA、EAPを通して障害者に活躍の場を提供するFLOW AI

限られた資源でデータ処理!デマ撃退の専門家Cofactsとその手法

スカイディスク 日本FLOWの協業でAIに不可欠なアノテーション ーAI外観検査をより手頃なコストで提供へー