2023.09.22
論文・発表
AI基盤・CoE

「確率的生成モデル(VAE)」と「自己教師あり学習(SSL)」の関係性を理論的に解明した技術がICCV2023採択

パナソニック ホールディングス株式会社は、「確率的生成モデル」と「自己教師あり学習」の関係性を解き明かし、画像の特徴をAI自身が自動で理解する画像認識AIを開発しました。


AIは大規模なデータセットを用いた学習を通じて、画像中に映る物体の特徴を把握します。高精度なモデル開発には、大量のデータセットに対して人によるラベリング作業が必要であることが課題視されており、近年は大量のラベルなしデータからAI自身に学習させる手法(自己教師あり学習など)の開発が進み、特にGPTに代表される自然言語分野で先行して大きな成果を挙げつつあります。一方、大規模なデータセットには、人が見ても判断が難しい「不確実性の高いデータ」(ノイズ、ボケ、光の反射などにより判断が困難なもの)がしばしば存在し、AIの学習を阻みます。この不確実性がAIの品質を下げることから、近年解決すべき課題として大きな注目を集めています。


本手法は、従来難しかった画像の不確実性を考慮した学習を実現するため、「確率的生成モデル」と「自己教師あり学習」を初めて理論的に統合しました。また、実験により、これまで「自己教師あり学習」で難しかった画像中の特徴の不確実性(AIにとって学習が難しい画像である度合い)を推定できることを実証しました。AI学習に必要とされるデータの「量」と「質」の課題を解決し、AIの信頼性を高められる汎用的な技術として、今後幅広い分野で活躍することが期待されます。


本技術は、「自己教師あり学習」のアルゴリズムを俯瞰できる理論を確立した学術的な貢献と先進性が国際的に認められ、AI・コンピュータビジョン技術のトップカンファレンスであるIEEE/CVF International Conference on Computer Vision (ICCV) 2023に採択されました(採択率26.15%)。2023年10月2日から2023年10月6日にフランスパリで開催される本会議で発表します。

論文リンク

プレスリリース

関連リンク

本手法で推定した画像の不確実性。
画像(左)は不確実性の低い画像、画像(右)は不確実性の高い画像と推定された。
(採択論文より引用 (C) 2023 IEEE)