2023.11.21
論文・発表
AI基盤・CoE

「階層的な画像認識を実現するマルチモーダル基盤モデル」に関して NeurIPS 2023 に採択

パナソニック ホールディングス株式会社(以下、パナソニックHD)は、大規模言語モデルの事前知識を活用することで、任意のテキスト入力に応じたセグメンテーション(画像中の物体を見つけ出し、画素単位で映っているものを識別すること)タスクを遂行できる画像認識向けマルチモーダル基盤モデルをカリフォルニア大学バークレー校と共同開発しました。本技術は、40以上の公開データセットを対象とした評価実験で、世界最高性能*1を達成しました。


本技術は先進性が国際的に認められ、AI・機械学習技術のトップカンファレンスである37th Conference on Neural Information Processing Systems(NeurIPS 2023)に採択されました(採択率26.1%)。2023年12月10日から2023年12月16日に米国ニューオリンズで開催される本会議で発表します。


*1  2023年11月21日現在(パナソニックHD調べ)

論文リンク

プレスリリース

関連リンク

画像とテキストの入力に応じて階層的な画像セグメンテーションを行うHIPIEの出力結果
(採択論文より引用)