用語 | 解説 |
---|---|
AI学習モデル |
INPUT(入力)に対して、何をOUTPUT(出力)するか、を判断する人工知能の脳を指します。 実際のモノとしては「関数(数式)」になります。 このモデルによって、犬の写真をINPUTすると、その写真が「犬」の写真であることを判断(OUTPUT)し、ある統計データをINPUTすると、その後の予測(OUTPUT)ができるようになります。 AIプロダクトの構築においては、このモデルが非常に重要であり、モデルの精度によって、プロダクトの価値が大きく左右されます。 |
アノテーション | AI学習モデルを構築する上で非常に重要なプロセスの一つです。 AIプロダクトの構築プロセスにおいて、AIモデルが特徴や法則を学習することができるようになるためには、学習のための教師データを取り込むことが必要になります。 この教師データを構築する作業が「アノテーション」と呼ばれるものです。 そのため、この教師データを疎かにすると、AIモデルは特定のINPUTに対して、正しいOUTPUTができないようになるため、アノテーション作業は、作業とは言え非常に重要なプロセスとなっています。 具体的には、写真の中から特定の物体を検出するための教師データとなる「Bounding Box(囲い込み)」や、同じく写真の中から、複数の物体の領域を抽出する「Segmentation」などの作業があります。 例)工場の検品業務における欠陥製品の発見、自動運転における白線・人・信号の認識 等 他にも、音声データから文字を起こす作業や、手書き文字から正しい文字データを作る作業など、構築したいAIプロダクトごとに様々な作業がアノテーション作業の対象となります。 |
クラウドソーシング | AIモデルの学習には、多くの教師データが必要となります。 但し、そのアノテーション作業を実際に実施することは非常に労力と工数がかかる作業となるため、クラウドソーシングを活用するケースが多くなっています。 一般的に「インターネット上の不特定多数に作業を委託することが可能な仕組み」を総称してクラウドソーシングと呼びます。 実際に、Google社は、マイクロタスク型のクラウドソーシングネットワークを保有するFigureEight社とパートナーシップを組み、Googleサービスの強化を行なっています。 ※参照:https://jp.techcrunch.com/2018/07/25/2018-07-24-figure-eight-partners-with-google-to-give-automl-developers-better-training-data/ |
Bounding Box | Bounding Boxとは、AIモデルを構築するためのアノテーション作業の一つであり、一般的には、ある画像から、特定の物体を検出するモデルを構築するための作業として行われます。 作業としては、ある画像の中から犬の位置を特定し、アノテーションツールを活用して犬の位置を囲う、といった画像の中の対象物の囲い込み作業になります。囲った位置を座標として取り出し、AIモデルの学習に活用します。 |
Semantic Segmentation(セマンティックセグメンテーション) | Semantic Segmentationとは、AIモデルを構築するためのアノテーション作業の一つであり、画像の中に何が写っているのか、を領域ごとに判断するモデルを構築するための作業として行われます。 作業としては、例えば道路の画像の中で、どこまでが道路で、どこに白線があり、どこにブロックがあるのか、というように、画像内の詳細の情報をピクセル単位で抽出し、対象の区分(道路、白線、ブロックetc.)に分類する作業です。 |
アノテーションツール | AIモデル構築におけるプロセスであるアノテーション作業を行いやすくしてくれる作業システムを指します。 デスクトップにインストールして使用するツールからサーバで動くツール、クラウドで提供されているツールなど様々なツールが存在します。 |
VoTT | Microsoft社の提供する、動画や画像に対してBounding Box等のアノテーション作業を可能にしてくれるアノテーションツールです。 VoTT:https://github.com/Microsoft/VoTT/releases |
labelImg | Github上で提供されている、画像アノテーション用のアノテーションツールです。 labelImg:https://github.com/tzutalin/labelImg |
JSONデータ | BoundingBoxやSemanticSegmentationのアノテーション作業を実施後、作業のアウトプットは一般的にJSON形式のファイルデータとして出力されます。 JSONデータには、対象クラスの画像のXY座標等が記述されており、このデータを用いてAIモデルは学習を行います。 |
VoTT | Microsoft社の提供する、動画や画像に対してBounding Box等のアノテーション作業を可能にしてくれるアノテーションツールです。 VoTT:https://github.com/Microsoft/VoTT/releases |