チューリングが日本初の自動運転向けVLAデータセット「CoVLA」を発表、WACV2025で論文採択
PR TIMES より
スポンサーリンク
記事の要約
- チューリングが自動運転向けVLAデータセット「CoVLA」を発表
- 日本語LLM「LIama-3-heron-brain-70B,8B」を公開
- WACV 2025で研究論文が採択
スポンサーリンク
チューリングが日本初の自動運転向けVLAデータセット「CoVLA」を発表
Turing株式会社は日本初の自動運転向けVision-Language-Action (VLA) モデルデータセット「CoVLA Dataset」を開発し、2024年9月10日に一部を公開した。このデータセットは80時間以上の運転データで構成されており、データの規模とアノテーションの多様さにおいて国外の既存データセットを上回っている。[1]
CoVLA Datasetを用いて開発されたVLAモデル「CoVLA-Agent」は、画像から得た運転環境を自然言語で詳細に説明し、適切な経路計画を生成することが可能だ。このデータセットの研究論文「CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving」が、コンピュータービジョンの主要な国際会議WACV 2025において採択された。
さらにチューリングは、自動運転マルチモーダルモデルのベースとなる日本語LLM「LIama-3-heron-brain-70B,8B」も公開した。このモデルは日本の言語ニュアンスや道路状況を詳細に理解し、対応可能な指示学習済みのLLMであり、GENIACプロジェクトの共有ベンチマークにおいてgpt-3.5-turboを上回る結果を示している。
CoVLA Datasetの主な特徴
データ構成 | 規模 | 特徴 | |
---|---|---|---|
CoVLA Dataset | 車載センサーデータ | 80時間以上の運転データ | データ規模とアノテーションの多様さが国外データセットを上回る |
CoVLA-Agent | VLAモデル | - | 運転環境の詳細な説明と適切な経路計画の生成が可能 |
LIama-3-heron-brain-70B,8B | 日本語LLM | 最大730億パラメータ | 日本の言語ニュアンスと道路状況を理解し、高い性能を発揮 |
スポンサーリンク
VLAモデルについて
VLAモデルとは、Vision(視覚)、Language(言語)、Action(行動)の3つの要素を統合した人工知能モデルのことを指しており、主な特徴として以下のような点が挙げられる。
- 画像情報を理解し、自然言語で説明可能
- 言語指示に基づいて適切な行動を生成
- 複雑な環境下での意思決定に活用可能
自動運転分野におけるVLAモデルは、カメラで捉えた周囲の状況を理解し、適切な運転行動を決定するために重要な役割を果たす。CoVLA Datasetを活用したVLAモデルは、さまざまな運転シナリオにおいて一貫性のある言語生成と行動出力を示し、自動運転技術の発展に大きく貢献することが期待されている。
自動運転向けVLAデータセット「CoVLA」に関する考察
CoVLA Datasetの公開は、日本の自動運転技術開発において画期的な出来事だ。このデータセットにより、国内の研究者や開発者がより高度な自動運転AIの開発に取り組むことが可能になる。一方で、大規模なデータセットの管理やプライバシー保護の観点から、データの取り扱いに関する厳格なガイドラインの策定が今後の課題となるだろう。
VLAモデルの発展に伴い、自動運転車の判断プロセスがより人間に理解しやすくなることが期待される。これにより、自動運転システムの信頼性向上や社会受容性の促進につながる可能性がある。今後は、より複雑な交通環境や予測困難な状況への対応能力を向上させるため、エッジケースを含むデータの収集と、モデルの継続的な改善が重要になってくるだろう。
チューリングの取り組みは、日本の自動運転技術の国際競争力強化にも寄与すると考えられる。今後は、産学連携をさらに強化し、CoVLA Datasetを活用した研究成果の実用化や、国際標準化への貢献など、グローバルな視点での技術開発と展開が期待される。自動運転技術の進化は、交通事故の削減や移動の利便性向上など、社会課題の解決にも大きな影響を与える可能性を秘めている。
参考サイト
- ^ PR TIMES. 「チューリング、日本初の自動運転向けVLA(Vision-Language-Action)モデルデータセット「CoVLA Dataset」を発表、WACV2025に論文が採択 | Turing株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000054.000098132.html, (参照 24-09-11).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- 【CVE-2024-37489】OceanWP用Ocean Extraにクロスサイトスクリプティングの脆弱性、WordPressサイトの早急な対応が必要に
- シーメンスのSINEMA Remote Connect Serverにコマンドインジェクションの脆弱性、CVSS v3深刻度8.8の重要度
- 【CVE-2024-24986】インテルのLinux用ethernet 800 series controllers driverに重大な脆弱性、情報漏洩やDoSのリスクに
- 【CVE-2024-26025】インテルのIntel AdvisorとoneAPI base toolkitに深刻な脆弱性、情報漏洩やDoSのリスクに
- 【CVE-2024-6789】M-Files ServerにパストラバーサルのCVSS6.5脆弱性、迅速な更新が必要
- 【CVE-2024-45287】FreeBSDに整数オーバーフローの脆弱性、DoS攻撃のリスクが上昇
- 【CVE-2024-45107】Adobe Acrobat/Readerに解放済みメモリ使用の脆弱性、ASLR回避のリスクに注意
- 【CVE-2024-45074】IBMのwebMethods Integrationにパストラバーサルの脆弱性、情報漏洩のリスクに警戒
- 【CVE-2024-35133】IBMのSecurity Verify Accessにオープンリダイレクト脆弱性、迅速な対応が必要に
- ZIAIが世界自殺予防デーに傾聴AIを無償開放、24時間365日の自殺予防支援を提供
スポンサーリンク