in

【データ処理の戦略的思考】防犯監視はデータから始めます

文/ Jessica Chien, FLOW AIデータ処理事業部担当者

【要約】
1, セキュリティシステムの需要は着実に増えており、収集したデータの種類も用途によって千変万化な状態で、AI応用の困難度を大幅引き上げています。

2, FLOWのAIデータチームは「的撃ち戦略」によりデータ解析のプロセスを再構築し、さらなる効率化を図ると同時にお客様のニーズにお応えいたします。

セキュリティ産業のAI化が始めてから、市場機会は更に拡大しています。調査会社《Marketsandmarkets》の報告によると、ビデオ監視産業の世界市場規模は2018年の368.9億ドルから2023年の683.4億ドルまで年平均13.1%の勢いで成長すると予測されています。このビッグウェーブに向けて、企業としては如何に速やかにAIの導入と実用化を実現すべきか?

台湾において、セキュリティシステムの発展は比較的に成熟しています。衣食住をはじめ交通、教育や娯楽まで、考えられる全ての人間の基本欲求に「セキュリティ」という単語を足すだけで瞬く間にビジネスチャンスに早変わりです。スマホの指紋や顔認証、建物の侵入者をリアルタイムで認知するモニタリングシステム、家族やペットを遠隔で見守るカメラ、果てに高齢者の看護まで、これらすべて随時フィードバックにより状況を確認し、ユーザーの安全を守ることが可能です。

例えば日本政府は天皇陛下の即位の礼の際に、AI顔認証システムを利用して儀式に参列する世界各国の要人を即時見分け、式典の警備に大きく貢献しました。2020年開催予定だった東京オリンピックもAI技術を9つの都道府県と40個の会場をまたがり、一千万人以上の参加者が予想される一大イベントのセキュリティ対策の一つとして採用する見込みです。

また、デパートや小売店、ジムなどの消費活動が活発な場所では、セキュリティシステムは人流計測や動線解析、消費者の年齢・性別・行動などの情報を分析し、より精確なマーケティングをするためにも使用されています。食品安全の分野においても、減農薬栽培や、作物の損害確認もまたその応用に該当します。

本来の目的である安全保障においても、ハードウェアとソフトウェアの両方を整合しない限り機能しません。そのため、「人工知能 X セキュリティ」を如何に既存製品に落し込むか、多くの技術・製造業は日々そのソリューションを求めて研究を進めています。

利用シーンによって変化するAIセキュリティ

他の産業と比べて、AIセキュリティが学習するシチュエーションは主に特定の室内環境に限られており、教師データの変動性は低い。現在、このような学習用オープンデータは既に市場に出回っていますが、企業によって利用シーンがそれぞれ違うため、これとは別にAIに特定の利用シーン、例えばデパートやスーパーなどの映像データを与えることで自分のビジネスモデルに適したAIモデルの作成を促進することも可能です。

環境の光線や明暗などの要素の影響も受けるため、実地で入手したデータは非常に重要な役割を担います。同じ「人流」でも、エントランス/陳列窓前/エスカレーターで求められる「データ種類」は大きく異なるし、後のAIとアルゴリズムの開発比重も変わってきます。そのため、問題の定義は明確にしておかねばなりません。

応用分野によってはテータ集めが大きな課題になるでしょう。利用シーンがプライバシー問題に引っかかる場合、どのように継続的にデータを収集し、なおかつ独自性を確立するのかは、セキュリティデータ戦略を策定する上での最初のハードルとなります。

そんな中、Tomofun株式会社は参考価値のある一例です。2019年、弊社と台湾の大手メディア天下雜誌が合同で開催したAI実践ワークショップでは、TomofunのCEOであるビクター・チャン氏は非常に印象に残る経験談を話してくれました。

起業当初、ビクターはハードウェア部分に該当するカメラを販売していましたが、後に遠隔で愛犬のお世話ができる「Furboドッグカメラ」というペットカメラの月額サービスに舵を切りました。ハードウェアからハード・ソフト両方の融合まで、最も大事なのは「消費者の利用シーンを十分に理解したうえで検証することだ」と彼は学んだという。

Tomofunの着眼点は家で留守中の犬の安全を守ることにありますが、こういったデータの収集はユーザーの住居のプライバシーに侵害してしまう恐れがあります。犬が嘔吐・むせた時をカメラで検出したいが、そんな映像はSNSで探してもなかなか手に入りにくい。そこでTomofunが打ち出した対策は、ユーザーたちに「データの共創者」になるよう助けを求め、不定期にSNSなどで映像を募集する形にしました。


始動:ゴールから始めるデータ思考

学習データの供給源が安定して機械学習の段階に移行したら、次に優先すべき項目はAIに人・動物・持ち物の識別を教えることとなります。物体識別の学習が終わったら、さらに二つの方向に向けて認識能力を高めていきます:

1、Tracking:ターゲットの連続性、移動ルートの追跡
2、Action:ターゲットの身体行動

道路上に出てきそうなオブジェクトを、全部AIが認識できるようにするだけでも対象物は50種類以上あります。バイクの場合だと、更にバイク・ライダー・後部乗客の3つのカテゴリに分けられます。また天候などによって交通状況も変化しますので、これらの条件も全て考慮しなければなりません。

AIの初期段階、つまり機械に「人間」を正しく認識するだけでも多くの企業は苦戦を強いられます。これからご紹介する事例は、もしかすると何らかのヒントになれるかもしれません。

人間の頭部は丸いので、ターゲット(人)の周辺に丸い物体がある、もしくは通行人の頭も一緒にボックス範囲内に入った場合、AIは「丸い物体=人間の頭」だと勘違いし間違ったことを学習してしまいます。

そこで、新しいロットの画像データを用意する際、これまでの収集方針を変えてデータのシシチュエーションをできるだけシンプルにすることをお客様に提案しました。学習させたい重点特徴を明確にし、アノテーションの方針を「的撃ち戦略」に切り替えます。

つまり、先にラベルを付ける人体の重点エリア(的)と切り捨てていい部分をマークしておきます。弊社のアノテーションチームが参加した後、周りのノイズを排除して、重点部分にだけバウンディングボックスを引いて、アノテーションの正確性を確保します。プロジェクトが終わった後、お客様から「アルゴリズムのトレーニングにこのデータを入れたらかなり改善されて、AIのズレを修正できた」というお声をいただきました。


省エネ&時減、最適化をお試しあれ

機械学習モデルの性能を向上させるためには、時に「尋常じゃない」解決策を見出す必要があります

例えば、お客様の目指す学習目標は「同一人物かどうかを識別する」ということですが、人間の思考ロジックに沿うと、一人の移動ルートを識別・追跡するには性別や年齢の他に、髪型、服装、色、アクセサリーなども観察する必要があります。

しかしこのような複雑な条件を特徴として機械に学習させると、開発チームは多くの時間と労力を費やすことになるでしょう。

弊社はお客様から目標と希望のアノテーションルールについて相談した後、真っ先に始めたのはラベリング作業ではなく、意見を纏めるところからでした。

「迅速かつ省エネでラーニングをするには、どのような方法があるのか?」

弊社のBDとPMチームが考えに考えた末、革新的なソリューションを一つ提案しました。それは、人間の思考ルーチンでAIを訓練するより、AIの得意なやり方──つまり「パラメータ」を基に識別すればいいのです。

我々は既存のツールを駆使し、新しいキーポイント・ラベリング法を作成しました。モデルデザインの簡素化の他に、アノテーターはターゲットの服装の特徴など考えなくて済むので全体の作業効率は大幅に上昇しました。


体制面からアノテーションの歩留まりを改善

例えばルールが画面中の「50ピクセル以上の車両」にだけラベルを付けると仮定します。一般の外部プラットフォームでラベリングを行う際、それぞれの画像のズーム倍率にズレがあるため、目で直感的に車両の長さと幅が50ピクセルを超えているかどうかを判断できず、ボックスの右下に表示される画素数に注目するしかありませんので、神経がすり減ると同時にミスも起こりやすくなります。

スマートリテール業界では、消費者情報分析の需要が急上昇しています。大量の顔写真からどの客がAグループで、どれがBグループに属しているのかを判断する必要があります。

ところが、お客様は高い歩留まり率を求めています。ではどうすれば期待に応えられるのか? 

事前の教育訓練はもちろん、同時にワークフローの改善を加え、我々は「投票システム」で解決することにしました。枠引き作業が終わった画像データは次の段階である比較作業に入り、そこで投票システムが作動し、個人の認知バイアスを最低限に抑えるために訓練を受けた複数の専門アノテーターに議論の余地のある画像を同時に判断してもらいます。

行動分析関聯のプロジェクトだと、キーポイント・ラベリングを使用して人体と動物の行動の識別を実現します。一般的に17個、多い場合は25個以上のキーポイントに分けてラベリング作業を行います。

点をつけるだけ、と聞くと簡単な作業に思えるかもしれませんが、実際はそうではありません。例えば移動中の人体、その骨格の関節のスタートポイントはどこにあるのでしょうか?或いは腕が物に隠れて見えない場合、どうやって関節を見つけ出して点をつけるか?犬猫のラベリングでも、関節の位置が人間と違うので、肢体の可動域も異なります。そしてあまり有名な話ではないが、実は猫の柔軟性は犬よりも優れています。これらは全て誤判断に繋がりうる要素です。緻密なルール設定と教育訓練がないと、品質の維持は難しいでしょう。

AIの運用に使われるデータ種類は様々で、プラットフォームやツール、やり方もそれに応じて最適化しないと効率と安定性を確保できません。例えば前述の件に関して、弊社は現在あらかじめ定義された人体骨格に幾つかのキーポイントを設置するだけで、AIが自動的に全体の関節に残りのキーポイントを生成するスマートツールを開発しています。これによりアノテーターはポイントの位置を調整するだけでいいので、作業速度の大幅向上を期待できます。

AIプロジェクトの根本であるデータに力を入れれば、精確なデータは助力となり夢であるAIの早期導入をきっと叶えてくれるはずです。

 AIを導入するに当って、「設備」「技術」「戦略」のどれ一つとして欠かせません。ここ2年の台湾ではAIに手を伸ばす企業が着々と増えており、データ処理のプロセスは企業の技術活用に対する戦略的思考に深く関聯します。それ故弊社は、その過程でお客様と共にある3つの質問について考えます ➡️➡️ スマートインダストリアルのはじめ方

画像出典:Amazon Rekognition、Bossa Nova Robotics、若水Flow


トレンドマイクロ社とFLOW AIのアノテーションチームが提携、 Lineで虚偽報道撲滅に一役買う

【AI欠陥検査実例】データ専門家による、ドローン活用のスマート保安で橋梁・危険建物を点検