|
|
|
|
曖昧な情報を持つ弱ラベル付きデータの活用により、学習データの作成にかかる工数を削減 |
東京, 2022年5月30日 - (JCN Newswire) - NECは国立研究開発法人理化学研究所(以下、理研)と共同で、AIを活用した画像認識において、新たな対象物を追加登録する際に必要となる学習データの作成作業を大幅に簡素化する技術を開発しました(注1)。現場でのAI適用の促進に貢献します。
近年、建設現場や工場における作業や状況の見える化など、様々な用途において画像認識技術の活用が広がっています。しかし、画像認識を新たな建設現場や工場に展開するためには、工具・材料・重機など新たな検知対象を継続的に登録することが必要となります。このような場合、従来は新たな検知対象だけでなく、既存の検知対象についてもAIに対象物の位置とそれが何であるかの情報を教える必要があるため、学習データの作成が利用者の大きな負担となっていました。
本技術は、AIの学習に曖昧な情報を活用できる「弱ラベル学習」という技術を発展させることで、AIを活用した画像認識に対象物を追加登録するときに問題となる学習データ作成の手間を削減するものです。弱ラベル学習は「学習が不安定になり精度が低下する」という問題がありましたが、今回NECと理研は弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを世界で初めて開発しました(注2)。なお本技術を活用すると、80種類の検知対象物を含む画像認識において、学習データ作成時間を75%削減できることを確認しました(注3)。
一般的に、AIを活用した画像認識において対象物を追加登録する場合、新たな検知対象のみをラベル付けしたデータでモデルの学習ができれば、作業に必要となる時間を大幅に削減することが可能です。
このようにAIを活用した画像認識の学習データにおいて、一部のみがラベル付けされ、それ以外の領域は何であるかが曖昧な「弱ラベル」が付与されたデータである、とみなして学習する手法として「弱ラベル学習」があります。例えば、トラックやバスなどの車両を認識するAIに新たに「バイク」を学習させる場合、トラックやバスや背景に対してラベル付けしないことは、それらが「バイクではない」という弱ラベルを付与したことに相当します。弱ラベル学習の手法により、このように「バイク」のみをラベル付けしたデータからでも学習可能となり、データ作成の作業工数を大幅に削減できます。
完全なラベルが付与されたデータを用いてモデルを学習する場合には、出力値が正解データに近づくようにモデルを最適化します。これに対して、弱ラベル学習では、弱ラベルに基づいてモデルの予測の正しさを逐次推定しながらモデルを最適化しますが、ラベルの曖昧性に起因して学習が不安定になり、高精度なモデルを学習できないという問題が知られていました。
本技術では、学習時の不安定性を解消するための補正を加えながら学習することで、この問題を解決しました。一般に、学習時に補正を加えると、学習が安定する代わりに、本来の目的である「対象物を正しく推定するモデルを学習」できる保証がなくなります。今回NECと理研は、弱ラベル学習の安定化と正しいモデルの学習の両方を同時に満たすアルゴリズムを世界で初めて開発しました。これにより、弱ラベルが付与されたデータからでも高精度なモデルを学習可能です。
なお本技術は、機械学習・人工知能の分野で著名な国際会議ICML (International Conference on Machine Learning) 2021に採択され、発表しています。(注4)
本リリースの詳細は下記をご参照ください。 https://jpn.nec.com/press/202205/20220530_02.html
概要:日本電気株式会社(NEC)
詳細は www.nec.co.jp をご覧ください。
トピック: Press release summary
Source: NEC Corporation
セクター: Cloud & Enterprise
https://www.acnnewswire.com
From the Asia Corporate News Network
Copyright © 2024 ACN Newswire. All rights reserved. A division of Asia Corporate News Network.
|
|