データグリッドの画像生成AI論文がWACV 2025に採択、Harmonizing Attentionで物体転写の精度向上を実現

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

PR TIMES より

記事の要約

データグリッドの論文がWACV 2025に採択
Harmonizing Attentionアーキテクチャを提案
物体転写で世界最高精度を達成

データグリッドの画像生成AI論文がWACV 2025に採択

株式会社データグリッドは、画像生成AIに関する研究論文「Harmonizing Attention: Training-free Texture-aware Geometry Transfer」がWACV 2025のメインカンファレンスに採択されたことを2024年9月2日に発表した。この論文では、インペインティング用の事前学習済み拡散モデルを活用した新しいアーキテクチャ「Harmonizing Attention」を提案している。^[1]

Harmonizing Attentionは、拡散モデルのinversionプロセスと生成プロセスにおいてself-attention layerをカスタマイズすることで、テクスチャと幾何学的特徴を独立に抽出・生成することを可能にしている。この手法により、従来の拡散モデル等の生成モデルでは困難だった幾何学的特徴の自然な転写生成を実現し、物体転写に関する主要な評価指標で世界最高精度を達成した。

この技術は既に同社の製造業向けAIデータ生成基盤「Anomaly Generator」に搭載されており、外観検査でNGデータ不足の課題を抱える多くの顧客に活用されている。Anomaly Generatorは、局所的生成技術に関する特許とHarmonizing Attentionをベースに、少数の不良品データから多様な不良品データを網羅的に生成できるソフトウェアだ。

WACV 2025採択論文の概要

項目	詳細
論文タイトル	Harmonizing Attention: Training-free Texture-aware Geometry Transfer
採択会議	WACV 2025（IEEE/CVF Winter Conference on Applications of Computer Vision 2025）
採択ラウンド	Round 1（採択率12.1%、167/1381本）
提案手法	Harmonizing Attention（インペインティング用事前学習済み拡散モデルを活用）
主な成果	物体転写に関する主要評価指標で世界最高精度を達成
実用化状況	製造業向けAIデータ生成基盤「Anomaly Generator」に搭載済み

Anomaly Generatorの詳細はこちら

拡散モデルについて

拡散モデルとは、画像生成AIの一種で、ノイズを徐々に除去しながら画像を生成する手法のことを指す。主な特徴として以下のような点が挙げられる。

高品質な画像生成が可能
多様性のある画像生成ができる
条件付き生成や画像編集にも応用可能

データグリッドの提案したHarmonizing Attentionは、この拡散モデルを基盤としつつ、self-attention layerをカスタマイズすることで、テクスチャと幾何学的特徴の独立した抽出・生成を実現した。これにより、従来の手法では困難だった幾何学的特徴の自然な転写生成が可能となり、物体転写タスクにおいて世界最高精度を達成するという画期的な成果を上げている。

Harmonizing Attentionに関する考察

Harmonizing Attentionの採用により、製造業における外観検査の精度向上が期待できる。不良品データの少なさという従来の課題に対し、多様な不良品データを生成することで、より網羅的な検査システムの構築が可能になるだろう。一方で、生成された不良品データの品質や多様性の確保、実際の不良品との整合性の検証など、実用化に向けてはさらなる課題が存在する可能性もある。

この技術の応用範囲は製造業に留まらず、医療画像診断や自動運転における物体認識など、様々な分野への展開が考えられる。特に、データ不足が課題となっているレアケースの学習や、プライバシー保護の観点から実データの使用が制限される場面での活用が期待できるだろう。今後は、他の画像生成手法との比較検証や、より複雑な物体や背景への対応など、技術の更なる発展が求められる。

また、Harmonizing Attentionの基盤となる拡散モデルの研究は日進月歩で進んでいる。今後はより高速な生成や、より大規模なモデルの開発など、技術的な進化が予想される。データグリッドには、この技術を核としつつ、実用的なソリューションの開発と、学術的な貢献の両立を期待したい。産学連携をさらに強化し、日本発の画像生成AI技術のグローバルスタンダード化を目指すことも、今後の重要な方向性の一つだろう。

参考サイト

^ PR TIMES. 「データグリッド、生成AIの論文がコンピュータービジョン分野の国際会議WACV 2025のメインカンファレンスに採択 | 株式会社データグリッドのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000049.000034722.html, (参照 24-09-04).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。