東京理科大学とNECが大規模視覚言語モデルの選択的忘却技術を開発、モデルの効率化と安全性向上に期待

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

IT・テックのコネクトメディア「ゼゼック」
カテゴリ毎のアーカイブ記事一覧
【カテゴリ別】2024年12月のアーカイブ一覧
【2024年12月】AIに関するアーカイブ一覧
【2024年12月11日】AIに関するアーカイブ一覧
東京理科大学とNECが大規模視覚言語モデルの選択的忘却技術を開発、モデルの効率化と安全性向上に期待

記事の要約

東京理科大学とNECがBlack-Box忘却技術を開発
VLMから特定情報の認識を選択的に抑制が可能に
小規模モデル構築と情報漏洩リスク低減に期待

大規模視覚言語モデルにおける画期的な忘却技術の開発

東京理科大学と日本電気の研究グループは、大規模視覚言語モデル(Vision-Language Model、VLM)において特定の情報だけを認識しないように忘却させる技術「Black-Box忘却」を2024年12月10日に開発した。この技術は、モデルの構造やパラメータが未知である条件下でも選択的な忘却を可能にする世界初の手法として注目を集めている。^[1]

Black-Box忘却技術は、潜在コンテキスト共有という新たなパラメトリゼーション法を採用することで、最適化問題の規模を大幅に削減することに成功した。この革新的なアプローチにより、各コンテキストの意味的類似性を活用しながらプロンプトの表現能力を維持しつつ、効率的な忘却処理が実現可能となった。

研究グループは複数のデータセットを用いた実証実験を通じて、Black-Box忘却技術の優位性を確認している。実験結果から、記憶したクラスに対する分類精度において従来手法を上回る性能を発揮することが示され、大規模モデルの効率的な運用に向けた重要な一歩となっている。

Black-Box忘却技術の特徴まとめ

項目	詳細
開発機関	東京理科大学・日本電気研究グループ
技術名称	Black-Box忘却
主要機能	特定情報の選択的認識抑制
特徴的手法	潜在コンテキスト共有によるパラメトリゼーション
期待効果	モデルの軽量化と情報漏洩リスクの低減

視覚言語モデル（VLM）について

視覚言語モデル（Vision-Language Model）とは、画像とテキストを同時に処理できる人工知能モデルであり、以下のような特徴を持つ。

画像認識と自然言語処理を組み合わせた統合的な処理が可能
訓練データにない新しいクラスの分類にも対応可能
画像とテキストの相互理解による高度な認識能力を保有

視覚言語モデルは、大規模な事前学習により優れた性能を発揮するが、その反面で計算コストが高いという課題を抱えている。商業利用においては多くの場合、モデルの詳細が非公開となっており、効率的な機能調整が困難な状況が続いていた。

Black-Box忘却技術に関する考察

Black-Box忘却技術の開発により、大規模モデルの効率的な運用と情報セキュリティの両立が現実的なものとなった。特に自動運転システムのような特定用途に特化したアプリケーションにおいて、必要な認識機能のみを残すことで処理効率の向上とリソース消費の最適化が期待できるだろう。

今後は忘却技術の精度向上と適用範囲の拡大が重要な課題となるはずだ。特に画像生成モデルへの応用においては、望ましくないコンテンツの生成を効率的に抑制する手段として期待が高まっている。忘却技術の発展により、より適切で効率的なAIシステムの実現が見込まれる。

商業利用における課題として、忘却処理の安定性と再現性の確保が挙げられる。企業が保有する大規模モデルの運用において、特定の情報を確実に忘却させることの重要性は今後さらに高まるだろう。技術の標準化と品質保証の仕組み作りが、実用化に向けた重要な鍵となるはずだ。

参考サイト

^ 東京理科大学. 「詳細が未知の大規模視覚-言語モデルから不要な知識を『忘却』させる技術を開発～より軽量かつ効率的な新しいモデルの構築につながる成果（NeurIPS 2024採択）～｜東京理科大学」. https://www.tus.ac.jp/today/archive/20241210_3948.html, (参照 24-12-12).
NEC. https://jpn.nec.com/

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム