in

【欠陥検査】プリント基板製造へのAI導入の仕方とは?AOIの誤検出率を抑える3つのコツ

文/ Jessica Chien, FLOW AIデータ処理事業部担当者

少し前に、台湾のあるPCBメーカーから弊社にAI導入についての打診がありました。

PCB(プリント基板)は非常に重要な電子部品です。「デジタル製品の母」とも呼ばれていて、台湾の主力産業の一つであり、2019年上半期の生産額は2,882億台湾ドルに達しています。

画像/ Jessica Chien, FLOW AIデータ処理事業部担当者

このお客様とやりとりしていくうちに、我々はPCB業界の現状を垣間見ることができました。初期不良がないように、PCBメーカーは主に「自動光学検査」(Automated Optical Inspection;AOI)設備で欠陥検査を行い、製造工程の品質管理を徹底しています。

しかしながら、AOIの高い誤検出率はメーカーにとっては頭を痛める問題です。

PCB業界は歩留まりへの要求が極めて高いです。AOIのしきい値は全般的に厳しく設定され、異常に敏感となった検査装置の誤検出率が7割を上回ることもあります。

その上、検査員による再検査も必要です。検出した欠陥の画像を数百倍に拡大し、本当に不良なのかを目視で再確認しなければいけないので、人員と大量の時間コストが生じます。

AIを導入するに当って、「設備」、「技術」、「戦略」のどれ一つとして欠かせません。ここ2年の台湾ではAIに手を伸ばす企業が着々と増えており、データ処理のプロセスは企業の技術活用に対する戦略的思考に深く関聯します。それ故、弊社はその過程でお客様と共に、この3つの質問について考えます:

1. 解決すべき問題とは?

2. 達成すべき目標は?

3. AIデータの形式、分類とデータ整備の決定木はどのような形?


問題とデータ形式を明確に定義することがキーポイント

何度も議論を重ねて、お客様は目標を2つ設定しました。

まずは、AOIの誤検出率を下げて手作業での再検査時間を短縮することです。AIを利用して疑似欠陥(False Positive)、つまりAOI装置が欠陥だと判断するが実際はそうではない欠陥の画像データを排除;次に、欠陥の種類を識別してその原因を特定することです。欠陥だと判定すればどの種類に該当するかを識別し、設備のデータと組み合わせて原因を洗い出します。

AIデータ処理の観点からお客様の目標を考えると、繰返し明確にする必要のあるテーマが3つあります:

1. 欠陥の定義(Classification)

2. 欠陥範囲の特定(Localization)

3. AIが本当に学習すべきデータとは?

PCBの製造工程では、欠陥画像のピクセル数や、露出オーバーに繋がる光源、カメラ位置の高さなど一見関係ないように見えて、実はアルゴリズムの学習に影響を与える要素が散りばめられています。

そこで、弊社は「投票システム」を提案しました。一つの作業項目を三人のアノテーターに判断してもらい、AOIの検出結果が正しいかどうかを多数決で決めます。

欠陥の判定について、この時点でAOIに欠陥だと判断されたデータは2種類に分けられます:

1. 正確

2. 誤検出

アノテーターを介して2種類目の画像を事前に排除することで、本当に学習されるべき欠陥データだけを残すことができます。

アルゴリズムはデータから学んで成長していきます。人間とは違い、AIは学習してもある程度の知識量と枠を超える連想力を獲得できません。アルゴリズムに「A」=Aと教えても、「a」もAと同じなんてわからないわけです。

当時、弊社がお客様と何度も話し合いと定義を繰り返した結果、最大十数種類の欠陥データに重点を置くと確認しました。しかし各種類欠陥の判定ルールの定義、そして関聯データの収集だけでも大変な作業となりました。

このケースでは、一度判定ルールが曖昧に定義されると、アルゴリズムの識別能力を混乱させてしまいます。そのため、弊社のBD、PMとプロセスエンジニアは各種類の欠陥について集中的に議論し、明確で排他的な特徴定義と識別ルールを洗い出したことで決定木を形成し、誤判定率を低下させることができました。

大まかの判定ルールは決まりましたが、どこまでが欠陥なのかはメーカーごとに基準が違いますので、お客様によって実際の定義はまた異なります。

例えばこのお客様は元々「塵」をも欠陥の種類に入れようとしましたが、AOIが検出した画像データでは「黒い点」を「塵」と「汚れ」のどちらに定義すべきか、これを明確にするのは難しい。そこで、AIではなく製造工程の改良で塵問題を解決することになりました。


ルールとワークフローデザインを通じて、お客様のノウハウの標準化にご協力します

定義、選別、分類の作業を経て初めて、欠陥データのアノテーション作業に入ります。作業内容は「バウンディングボックス」と「分類」があり、AIに欠陥の種類と面積の大きさを学習させます。

この段階で、弊社は「ゴールデンデータセット」を使ってアノテーションの品質を随時検証しています。

「ゴールデンデータセット」とは、欠陥の分類が正しいと確定された「処理済みデータ(labeled data)」のセットです。プロジェクト進行中、弊社はこのゴールデンデータセットをワークフローにランダム配置してアノテーターに受け取ってもらい、その作業結果と比較し、抜き打ち検査でアノテーションの品質を確保します。

アノテーターが付けた答えがゴールデンデータセットと異なった場合、PMは直ちにその作業を止め、担当者は品質保証チームから手取り足取り指導を受けます。

このような二重仕組みを通して、アノテーターのルールへの理解度をリアルタイムで把握できるだけでなく、最終的にお客様のところに届くデータが高品質なものだけであることを保証できます。

興味深いことに、戦略的思考に基づいたデータ処理プロセスは、往々にしてAIの稼働前に既に管理の最適化を開始しています。

今回のPCB欠陥検査のケースがその一例です。データ整備の過程は欠陥判定のSOP作成に繋がり、同時に社内のノウハウを標準化することでエンジニアはより良く製造工程の問題点を把握でき、品質管理のフィードバック・ループを瞬時に形成します。これが、データ処理において最も大事な成果です。

【データ処理の戦略的思考】 スマート交通について知っておきたい3つのデータ特徴

トレンドマイクロ社とFLOW AIのアノテーションチームが提携、 Lineで虚偽報道撲滅に一役買う