業界専門知識が必要な図面の分類モデル
支援したプロジェクトの概要
解読に専門知識を要する設計図をマルチラベル分類するモデルを開発しました。
PoCの3ヶ月のPJで、分類精度61%~89%を達成(部分的には99%)。
複雑な図を解読するために、既存の人間のフローに着目し、アーキテクチャに採用。
複数の技術を適切に組み合わせることで、精度を向上させました。
解析の際に、図面全体だと精度が著しく下がってしまうため、OCRや、物体検出モデルを用いて図面範囲を削減。
絞られた範囲に対して、LLMや分類モデルを作成して分類問題を解く。
ラベル決定に必要な要素を物体検出するモデルを作成し、その要素ごとの位置関係やドメイン知識をコード化し、分類する。
独自モデル学習のために自動的なデータ増量手法を提案しました。
プロジェクト技術詳細
物体検出モデル (Faster R-CNN) の独自モデル開発
OCR モデル (Document Intelligence)
GPT系のモデルの利用(Azure Open AI)
