公開:

パナソニックHDとUC Berkeleyが共同開発したSegLLM技術により対話型セグメンテーションの精度が向上

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • パナソニックHDらが対話型セグメンテーション技術を開発
  • 言語と参照画像を用いて物体認識の精度が向上
  • ICLR 2025に採択され国際的な評価を獲得

パナソニックHDらが画期的な対話型セグメンテーション技術を発表

パナソニックR&Dカンパニー オブ アメリカおよびパナソニック ホールディングス株式会社は、カリフォルニア大学 バークレー校の研究者らと共同で、革新的な対話型セグメンテーション技術「SegLLM」を開発したことを2025年4月17日に発表した。この技術は、テキストと参照画像を組み合わせたプロンプト入力を実現することで、未学習の物体でも正確な認識が可能になっている。[1]

SegLLMの特徴として、過去の対話で認識した対象をもとに新しい指示を出す際に、テキストの複雑化を回避できる点が挙げられる。従来技術では対話が進むにつれて認識精度が低下する傾向があったが、SegLLMはセグメンテーション画像を参照画像として活用することで、高い認識精度を維持することが可能だ。

本技術の有効性は国際的な評価を受け、AI・機械学習分野の主要カンファレンスであるICLR 2025への採択が決定している。パナソニックHDは本技術をFastLabelと共同開発中の自動アノテーションツールに実装する予定であり、AI開発の効率化に大きく貢献することが期待されている。

SegLLMの主な特徴まとめ

項目 詳細
開発主体 パナソニックHD、PRDCA、UC Berkeley
主要機能 テキストと参照画像を用いた対話型セグメンテーション
技術的特徴 過去の認識結果を参照画像として活用可能
適用範囲 未学習物体、物体間の階層関係、物体間のインタラクション
今後の展開 自動アノテーションツールへの実装予定

セグメンテーション技術について

セグメンテーションとは、画像内を画素レベルで複数の領域に分割する技術のことを指しており、主な特徴として以下のような点が挙げられる。

  • 画像認識と連携した物体の位置・形状の正確な検出
  • 屋内での物体認識や自動車の周辺環境認識に活用
  • ロボットによる物体操作などの応用が可能

近年のセグメンテーション技術では、大規模言語モデル(LLM)を活用してテキストによる認識対象の指示が可能になっている。ただし従来技術では、対話的な指示を行う際にテキストが複雑化し誤認識が発生しやすい課題があった。SegLLMはこの課題を解決し、より正確な物体認識を実現している。

参考サイト

  1. ^ Panasonic. 「パナソニックHD、テキストと参照画像を用いて未学習の物体も指示できる対話型セグメンテーション技術を開発 | 技術・研究開発 | 技術・研究開発 | プレスリリース | Panasonic Newsroom Japan : パナソニック ニュースルーム ジャパン」. https://news.panasonic.com/jp/press/jn250417-1, (参照 25-04-18).
  2. 2479

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。