AIによる画像認識とは? 精度や導入の注意点、PoCの進め方を解説

公開 : 2021.07.28 
カテゴリー
タグ

こんにちは。シニアITコンサルタントの茨木です。
NCDCでは、サービス企画やUXデザイン、テクノロジーの分野でさまざまなサービス提供をしております。

最近「AIで画像診断をしたい」というご相談をいただくことが増えており、中には「高精度なものを簡単・早期に導入できる」と期待されている方もいらっしゃいます。

しかし、実際には「高精度」を「簡単・早期」で実現することは難しく、開発環境の準備からはじまり、AIに学習させる画像の用意、その後の精度の調整、そして現場の運用への組み込みなど、想像以上の手間がかかるものです。

本コラムではこうした期待と現実のギャップを解消するため、画像認識の基本的な仕組みと、難易度が高くなるケース、導入検討時によくある誤解などをご紹介したいと思います。

AIによる画像認識とは

「AI×画像」に関するご相談をいだく際に、お客様の方では「画像診断」「画像解析」「画像判定」などさまざまな言葉を用いられることがあるのですが、ほとんどはコンピュータによる「画像認識」の技術を指しているので、以降は「画像認識」で表現を統一して説明していきます。

技術的な詳細は省いてざっくり説明すると、AIによる画像認識とは、その名の通り画像をAIに認識してもらう技術です。
コンピュータは通常、画像も「単なるデータ」として扱うため人間と同じように「1枚の絵」としては認識しません。ところが画像認識AIを用いると、人間の目視判断に近いイメージで、見た目の特徴(画像パターンの特徴)による識別・分類などをコンピュータに実行させることができます。
スマホの顔認証など身近なところでも使われている技術なので、ほとんどの人が実体験しているはずです。

画像認識AIによる人と車の検知イメージ



AIによる画像認識には「機械学習」という技術が用いられていて、機械学習は「教師あり学習」「教師なし学習」の2タイプに分類できます。
このあたりも技術的な詳細を書くと長くなるので、「総務省 ICTスキル総合習得教材」を流用してざっくり説明します。

「教師あり学習」は、人間が結果や正解にあたる「教師データ」を決めて、それをAIに与えることで、AIが「正解は何か?」を学習していく方法です。
例えば、「猫」というラベル(教師データ)が付けられた大量の画像をコンピュータが学習することで、ラベルのない画像が与えられても、「猫」を検出できるようになります。

「教師あり学習」では、まず人間が判断した正解がAIに与えられていましたが、この正解に相当する「教師データ」を与えないのが「教師なし学習」です。

「教師なし学習」では、大量の画像をコンピュータが学習することで、画像の特徴(例:大きさ、色、形状)から自動的に「どんな種類の画像か」を分類できるようになります。
この場合、「猫」や「鳥」という正解のラベルは事前に与えられていないので、AIは「猫」や「鳥」を判別しているのではなく、単に形や色などが近い属性でグループ分けしているということになります。

「猫を見つけたい」等の明確な答えのあるタスクをAIに任せたい場合は教師あり学習を用いる。何が写っているかわからない大量の画像をAIに分類させたいというような場合は教師なし学習を用いる。
…こうしたかたちで、目的に応じて使い分けられています。

つまり、ひとくちに「AIによる画像認識」といっても、その仕組みを具体化していくためには、まず何を認識したいのか、どのタイプを用いるのかなどの条件を決めていく必要があるのです。

「教師あり学習」と「教師なし学習」の違いなど、基礎はご理解いただけたと思うので、ここからは具体例も用いて、もう少し詳しく画像認識AIの現実を解説していきます。

AIによる画像認識の具体例

NCDCへの相談は、次のような特定したい何かが決まっているものが比較的多いです。

  • 工場で製品の画像から出荷数をカウントする(AIに製品を認識させる)
  • 商業施設内の通路の画像から人流を検知する(AIに人を認識させる)

これらは「教師あり学習」を用いて行うので、次章からは「教師あり学習」に話を絞って、正確な画像認識が難しいケースやよくある誤解についてご紹介します。

画像認識の難易度が高いケースとは

基本的には、AIが学習するためのサンプルデータを用意できるものであれば機械学習による画像認識の実施が可能ですが、例えば次のような場合は精度が低くなったり、導入に多くのコストがかったりする可能性があります。

形状が似ているもの

色や形が似ていて、識別対象の正誤について人の目で見てもわかりにくいものはAIに正しく認識させるのも非常に難しいです。教師データを増やすことで精度の向上は可能ですが、多くの工数がかかりますし、高い精度は期待できません。

ニッチなもの、データがないもの

教師データがない場合、写真(データ)を集める、加工する、読み込ませるという学習の工程を0から実施することになるため、難しいというより多くの時間とコストがかかります。
反対に、一般的によく使われる対象物(人、車など)はすでに学習データがオープンソースとして提供されていることもあるため、そうしたリソースを活用すれば時間もコストも抑えることができます。

対象物が目視できないもの

形状に問題がなくても、カメラの視点から見た時に対象物が重なってしまう、光の当たり方で影に隠れてしまうなど、画像データ上で対象物の識別が難しい状態になるとAIに正しく認識させるのは非常に難しいです。これはAI側の問題ではなく画像取得側の問題なので、カメラの設置場所など環境を整備することで改善することができる場合もあります。

これらの例を見ただけでも「高精度な画像認識AIを簡単・早期に導入」するのは難しいことがご理解いただけるのではないでしょうか。
しかし、だからといってAIによる画像認識は役に立たないというわけではありません。
最初から過度な期待はせず、検証を重ねて導入のステップを進めていくことが大切です。

まず検証することがお勧め

これは経験則なので一概には言えませんが、教師データを数百件用意してPoCを行えば、今後の方針を検討できるレベルの精度は出すことができます。

もし期待していた結果が得られなければAI活用以外の方法を検討できますし、ある程度期待通りであれば追加学習をさせて精度を高くしていくことは可能です。
いきなり大量の教師データを用意して高い精度を求めるのではなく、まずはスモールスタートして実現可能性の判断をすることで、リスクを抑えて導入を進められます。

教師あり学習で精度を向上させる方法は、とにかくたくさんのデータを学習させる(教師データを与える)ことです。また、画像のパターンもバリエーション(昼・夜・夕方、単体・複数、近い・遠い など)を持たせて、偏りなく網羅することも重要です。

事例紹介
弊社がご支援したプロジェクトで、スモールスタートした後、教師データを増やしながら検証を繰り返し、AIを活用した新規事業の開発に取り組まれた事例があるので、こちらの記事もせひご覧ください。
百年以上の歴史を誇る老舗ハードウェアメーカーが挑む、AIを活用した新規事業開発

画像認識についてよくある誤解

実際にAIによる画像認識のプロジェクトを進めていくと、事前の期待と現実のギャップに驚かれる方も多いので、次によくある誤解をご紹介します。

画像認識の誤解「精度は100%にできる」

「機械(AI)を使うのだから人間より正確なはず」「すぐに精度は100%になる」と考えている方が意外と多いです。特に、業務効率化の仕組みとしてAIを使いたいと考えている場合「AIとは完全に人の代わりになって、人より高い精度の判断ができるものだ。そうでなければ困る」と期待されていることがほとんどです。

しかし、実際にはAIに与える教師データは基本的に人間が用意するものであり、人間の精度が100%になることはないので、当然AIも100%の精度になることはありません。
100%の精度が出て当たり前という過度な期待を持ってAIの導入を考えるのは禁物です。

ただし、前述したように時間と工数をかけて学習を定期的に追加していくことで精度を高めていくことは可能です。
大切なのは100%を前提とせず、どの程度の精度が必要なのか、誤認識があった場合はどう対応するのかなどを考えておくことです。

画像認識の誤解「99%でも高い精度だ」

精度100%という期待を持っていない方からは、反対に、99%の精度でも「十分に高い精度だ」と言われることがあります。
99%の精度が高いか低いかは条件により考え方が変わってきますが、99%の精度では十分ではないケースは多々あります。

例えば、施設の混雑状況を知りたいだけであれば100人のうち1人が間違いであっても誤差といえますが、工場での検品作業の場合は100個検品するたびに1つミスが出るようでは困りますよね。

このように、○%という抽象的な数字を現実の数字に反映させてみると、たった1%の誤差が経営に大きく影響することもありますので、導入検討の際は具体的な用途と、その用途ではどの程度の精度が必要なのかを整理しておく必要があります。

画像認識の誤解「AI導入で一気に現場が楽になる」

人による目視チェックの代わりにAIの画像認識を使いたいというようなケースでは、導入が実現すれば現場のスタッフが煩わしい作業から解放されて、一気に工数を削減できると期待されていることが多いです。
しかし、実際には導入直後に現場への負担が一時的に高まることも多々あります。

画像を取得する環境の整備、作業員の学習、オペレーションの見直し、エラーが発生した場合のリカバーの方法・AIへの追加学習の運用方法の策定など、従来は必要のなかった業務が発生するためです。

また、AI導入のためにいきなり現場に大きな変更を加えようとすると、従来の業務と噛み合わなくてオペレーションで苦労をすることもあります。
導入検討時には、なるべく現場の関係者からの意見や要望も取り入れて、実際の業務の中で無理なく使えるところからスモールスタートで取り入れていくことが大切です。

画像認識導入の前に考えておきたいこと

「よくある誤解」として3つの例を挙げましたが、こうした誤解を前提にプロジェクトを設計すると後々問題が生じてしまうのでご注意ください。
例えば、絶対に間違うことなく個数をカウントする必要がある、人命や安全に関わる判断を下す、という「失敗が許されない」状況においてはAIだけに頼ったオペレーションを設計することはおすすめしません。

最近はAIの活用が話題になることが多いのでAI利用のアイデアが出やすいかもしれませんが、解決策はそれだけとは限りません。
活用環境や対象となる物体が画像取得に適していないような場合、別のアプローチの方が安く正確にシステム化できることもあります。

反対に、精度の問題や運用で生じる課題、他に適したアプローチがないか等をしっかり検討した上で「AIによる画像認識で行うのが最適」と判断されたのであれば、試行錯誤をしながらそのプロジェクトを推進していただけると良いと思います。
仮に最初は精度や運用に難があったとしても、検証と改善を繰り返していけば徐々に導入の効果が現れてくるはずです。

「AI×画像認識」プロジェクトのはじめ方

スモールスタートして実現可能性の判断をする、検証と改善を繰り返すなど、AIによる画像認識プロジェクトの推進方法について何度か言及してきましたが、具体的にはどのようなやり方があるのでしょうか?

お勧めなのはクラウドサービスをうまく活用して検証を行うことです。
AIに関するサービスとしてはIBMのWatsonが有名ですが、その他にもアマゾン ウェブ サービス(AWS)、Microsoftが運営するAzure、Googleが運営するGoogle Cloud Platform(GCP)などのクラウド事業者がさまざまなサービスを提供しています。

ここでは各サービスの詳細な解説まではしませんが、例をあげると、クラウドサービスの活用によって次のようなメリットが得られます。

  • Amazon SageMaker:AWSが提供しているAmazon SageMakerは、画像認識を実施するための開発環境がクラウド上に揃っているので、これを活用することで開発のコストを抑えてプロジェクトをスタートできます。
  • Computer Vision:AzureのCognitive Servicesの1つであるComputer Visionは、画像認識の機能をSaaSで提供しているので、複雑な開発は不要で、機械学習に関する専門知識がない方でもAIによる画像認識を使うことができます。

AI活用はNCDCにご相談ください

NCDCでは、初期要件の検討段階から本格導入までご支援しており、プロジェクトの内容に即した最適な構成を提案させていただくことが可能です。
クラウドサービスをうまく活用した迅速なPoCの企画から、商用のシステム開発まで、豊富な実績に基づく実践的なご提案ができますので、「こんなことには使えるの?」「自社の運用に組み込める?」とお悩みの方は、ぜひお問い合わせください

ページトップへ

お問い合わせ

NCDCのサービスやセミナー依頼などのお問い合わせは
下記のお電話 また、お問い合わせフォームよりお気軽にご連絡ください。

050-3852-6483