Turingが自動運転向け大規模データセットCoVLA-Datasetを公開、世界モデルTerraとACT-Benchも同時リリースでマルチモーダル技術の発展に貢献
PR TIMES より
スポンサーリンク
記事の要約
- TuringがCoVLA-Dataset全データを公開
- 生成世界モデルTerraのソースコードを公開
- 世界モデル評価ベンチマークACT-Benchを発表
スポンサーリンク
自動運転向け大規模データセットCoVLA-Datasetとマルチモーダル技術の新展開
Turing株式会社は600万フレームにおよぶ自動運転マルチモーダルデータセット「CoVLA-Dataset」の全データを2024年12月23日にオープンデータとして公開した。マルチモーダル大規模言語モデルの研究開発に不可欠なデータセットの提供により、E2E自動運転システムの経路計画における応用研究の促進が期待される。[1]
同社は指定された未来軌跡への追随性を強化した生成世界モデル「Terra」のモデルファイルとソースコードも同時に公開した。生成世界モデルTerraはCoVLA-Datasetによる追加学習を通じて行動指示への適応力を向上させており、現実世界の複雑な状況を理解し映像生成することが可能である。
また世界モデルの行動指示追随性能を定量的に評価可能なベンチマーク「ACT-Bench」を発表した。世界モデルが与えられた行動指示にどれほど正確に追従できるか客観的な指標を提供することで、自動運転技術の開発における評価基準の確立に寄与するだろう。
自動運転向けデータセットと技術まとめ
項目 | 詳細 |
---|---|
データセット名 | CoVLA-Dataset |
データ規模 | 600万フレーム |
主要技術 | マルチモーダル大規模言語モデル |
公開モデル | 生成世界モデルTerra |
評価基準 | ACT-Bench |
国際会議採択 | WACV 2025 |
スポンサーリンク
マルチモーダル大規模言語モデルについて
マルチモーダル大規模言語モデルとは、画像や視覚情報とテキストや言語情報など複数種類のデータを統合的に処理できる人工知能モデルのことを指す。主な特徴として以下のような点が挙げられる。
- 画像と言語の両方を理解し処理が可能
- 複数のデータ形式を統合的に分析
- 高度な判断と予測を実現
自動運転技術においてマルチモーダル大規模言語モデルは複雑な道路状況の理解と適切な判断に不可欠な存在となっている。完全自動運転の実現には画像認識や自然言語処理を組み合わせた高度な判断能力が必要不可欠であり、CoVLA-DatasetやTerraの公開は技術革新の重要な一歩となるだろう。
参考サイト
- ^ PR TIMES. 「自動運転マルチモーダルデータセット「CoVLA-Dataset」全データを公開 | Turing株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000059.000098132.html, (参照 24-12-24).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Discoveryとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- ラクスがAIクレーム検知と自動応答機能を活用したカスハラ対策セミナーを発表、従業員の心身の安全確保と顧客満足度向上を実現
- ファインディが生成AI活用のエンジニアおみくじ2025を発表、運勢パターンが約18万通りに拡大へ
- 合同会社Opt.devが月額制Studio特化型コミュニティノーコードサロンを日本初リリース、デジタルスキル向上に期待
- MILIZEとTENTOが金融教育×プログラミングのワークショップ開催、2024年12月から年間24回の教育プログラムを展開
- 株式会社商談プロが次世代営業リストツールのβ版フリートライアルを2025年1月に提供開始、AIとインテントセールスで営業改革を加速
- BAKERUがショーケースのProTech ID Checkerを導入、Z世代向けSIMサービスの本人確認プロセスをDX化して業務効率を向上
- プロディライトがINNOVERA 2.0の新機能を公開、チュートリアル機能とお知らせ機能の実装でユーザビリティが向上
- GalirageとロートがRAG精度改善コンペを開催、製薬業界向け文書処理の技術革新を推進
- TD SYNNEXがIBM watsonx搭載アプライアンスサーバーを提供開始、オンプレミスでの生成AI開発環境の構築が容易に
- 江崎グリコとコカ・コーラボトラーズジャパンが物流効率化で環境負荷削減、グリーン物流優良事業者表彰を受賞
スポンサーリンク