2025.4.17
技術・研究開発

テキストと参照画像を用いて未学習の物体も指示できる対話型セグメンテーション技術がICLR 2025に採択

AI・データ分析 共通・その他 Panasonic×AI

パナソニック R&D カンパニー オブ アメリカおよびパナソニック ホールディングス株式会社は、カリフォルニア大学などの研究者と共同で、ユーザーの「いいね」や「嫌い」といったバイナリフィードバックで生成モデルを調整し、ユーザーの目的や好みに合わせた画像を効率よく生成できる画像生成AI“Diffusion-KTO(Knowledge Transfer Optimization)”を開発しました。

SegLLMは対話型セグメンテーションの性能を大幅に向上させる技術です。本技術は、パナソニックHDがFastLabelと開発を進めている自動アノテーションツール(※)に実装を予定しており、従来のテキストのみの指示では検出が難しかった対象(例えば、未学習の物体や特定の人物が持っている物体など)まで適用範囲が広がることで、AI開発の効率やスピードを左右するアノテーションのコスト削減と高精度化に向けてより汎用的なツールに進化させていきます。また、このようなSegLLMの特性を活かし、CPS(サイバーフィジカルシステム)へ応用することで、多種多様な器具・工具が存在するような工場・生産ラインにおいても現場毎の学習コストを削減できるため、工場等の最適化の加速に貢献していきます。

本技術は、先進性が国際的に認められ、AI・機械学習技術のトップカンファレンスであるInternational Conference on Learning Representations(ICLR 2025)に採択されました。2025年4月24日から4月28日までシンガポールで開催される本会議で発表します。

※[プレスリリース] パナソニックHDとFastLabel、アノテーションコストの大幅削減と高精度化を両立するAI開発効率向上に向けた協業を開始(2024年9月27日) https://news.panasonic.com/jp/press/jn240927-1

論文リンク

SegLLM: Multi-round Reasoning Segmentation
https://arxiv.org/abs/2410.18923
本研究は、PRDCAのKonstantinos Kallidromitis、UC-BerkeleyのXudong Wangらと、パナソニックHDの加藤 祐介、小塚 和紀による共同研究成果です。

プレスリリース

パナソニックHD、テキストと参照画像を用いて未学習の物体も指示できる対話型セグメンテーション技術がICLR 2025に採択
https://news.panasonic.com/jp/press/jn250417-1

関連リンク

Panasonic×AI WEBサイト
https://tech-ai.panasonic.com/jp/
Panasonic×AI X
https://twitter.com/panasonic_ai