Turingが自動運転向け大規模データセットCoVLA-Datasetを公開、世界モデルTerraとACT-Benchも同時リリースでマルチモーダル技術の発展に貢献

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

IT・テックのコネクトメディア「ゼゼック」
カテゴリ毎のアーカイブ記事一覧
【カテゴリ別】2024年12月のアーカイブ一覧
【2024年12月】AIに関するアーカイブ一覧
【2024年12月22日】AIに関するアーカイブ一覧
Turingが自動運転向け大規模データセットCoVLA-Datasetを公開、世界モデルTerraとACT-Benchも同時リリースでマルチモーダル技術の発展に貢献

Turingが自動運転向け大規模データセットCoVLA-Datasetを公開、世界モデルTerraとACT-Benchも同時リリースでマルチモーダル技術の発展に貢献

PR TIMES より

記事の要約

TuringがCoVLA-Dataset全データを公開
生成世界モデルTerraのソースコードを公開
世界モデル評価ベンチマークACT-Benchを発表

自動運転向け大規模データセットCoVLA-Datasetとマルチモーダル技術の新展開

Turing株式会社は600万フレームにおよぶ自動運転マルチモーダルデータセット「CoVLA-Dataset」の全データを2024年12月23日にオープンデータとして公開した。マルチモーダル大規模言語モデルの研究開発に不可欠なデータセットの提供により、E2E自動運転システムの経路計画における応用研究の促進が期待される。^[1]

同社は指定された未来軌跡への追随性を強化した生成世界モデル「Terra」のモデルファイルとソースコードも同時に公開した。生成世界モデルTerraはCoVLA-Datasetによる追加学習を通じて行動指示への適応力を向上させており、現実世界の複雑な状況を理解し映像生成することが可能である。

また世界モデルの行動指示追随性能を定量的に評価可能なベンチマーク「ACT-Bench」を発表した。世界モデルが与えられた行動指示にどれほど正確に追従できるか客観的な指標を提供することで、自動運転技術の開発における評価基準の確立に寄与するだろう。

自動運転向けデータセットと技術まとめ

項目	詳細
データセット名	CoVLA-Dataset
データ規模	600万フレーム
主要技術	マルチモーダル大規模言語モデル
公開モデル	生成世界モデルTerra
評価基準	ACT-Bench
国際会議採択	WACV 2025

マルチモーダル大規模言語モデルについて

マルチモーダル大規模言語モデルとは、画像や視覚情報とテキストや言語情報など複数種類のデータを統合的に処理できる人工知能モデルのことを指す。主な特徴として以下のような点が挙げられる。

画像と言語の両方を理解し処理が可能
複数のデータ形式を統合的に分析
高度な判断と予測を実現

自動運転技術においてマルチモーダル大規模言語モデルは複雑な道路状況の理解と適切な判断に不可欠な存在となっている。完全自動運転の実現には画像認識や自然言語処理を組み合わせた高度な判断能力が必要不可欠であり、CoVLA-DatasetやTerraの公開は技術革新の重要な一歩となるだろう。

参考サイト

^ PR TIMES. 「自動運転マルチモーダルデータセット「CoVLA-Dataset」全データを公開 | Turing株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000059.000098132.html, (参照 24-12-24).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム