「階層的な画像認識を実現するマルチモーダル基盤モデル」に関して NeurIPS 2023 に採択

パナソニックホールディングス株式会社（以下、パナソニックHD）は、大規模言語モデルの事前知識を活用することで、任意のテキスト入力に応じたセグメンテーション（画像中の物体を見つけ出し、画素単位で映っているものを識別すること）タスクを遂行できる画像認識向けマルチモーダル基盤モデルをカリフォルニア大学バークレー校と共同開発しました。本技術は、40以上の公開データセットを対象とした評価実験で、世界最高性能*1を達成しました。

本技術は先進性が国際的に認められ、AI・機械学習技術のトップカンファレンスである37th Conference on Neural Information Processing Systems（NeurIPS 2023）に採択されました（採択率26.1％）。2023年12月10日から2023年12月16日に米国ニューオリンズで開催される本会議で発表します。

*1 2023年11月21日現在（パナソニックHD調べ）

論文リンク

“Hierarchical Open-vocabulary Universal Image Segmentation” Xudong Wang, Shufan Li, Konstantinos Kallidromitis, Yusuke Kato, Kazuki Kozuka, Trevor Darrell: https://arxiv.org/abs/2307.00764; 本研究は、Panasonic R&D Center AmericaのKonstantinos Kallidromitisとカリフォルニア大学バークレー校による共同主著論文で、パナソニックHD テクノロジー本部の加藤祐介、小塚和紀が参画した研究成果です。

プレスリリース

パナソニックHD、階層的な画像認識を実現するマルチモーダル基盤モデルを開発: https://news.panasonic.com/jp/press/jn231121-4

「階層的な画像認識を実現するマルチモーダル基盤モデル」に関して NeurIPS 2023 に採択

論文リンク

プレスリリース

関連リンク