Turing社、高性能日本語VLM Heron-NVILA-Liteと大規模データセットを公開、自動運転技術開発を加速

PR TIMES より
スポンサーリンク
記事の要約
- チューリング社が日本語VLM「Heron-NVILA-Lite-15B/2B/1B」を公開した
- 15Bモデルは複数のベンチマークで高性能を達成、2BモデルはiPhoneでローカル高速推論可能
- 世界最大規模の自律移動データセット「STRIDE-QAデータセット」の一部を無償公開
スポンサーリンク
チューリング社による日本語VLMと大規模データセットの公開
Turing株式会社は2025年5月12日、新たな日本語VLM「Heron-NVILA-Lite-15B/2B/1B」を公開した。150億パラメータの15Bモデルは、複数の日本語視覚-言語ベンチマークにおいて同パラメータ規模のオープンモデルを上回る性能を達成しているのだ。
20億パラメータの2Bモデルは、iPhone上での完全ローカルかつ高速な推論が可能である。この開発は、経済産業省/NEDOによる生成AI研究支援プログラム「GENIAC」の一環として実施された。
さらに、インターリーブ形式で構築された世界最大規模(自社調べ、インターリーブ形式の日本語-画像のデータセットとして)の日本語-画像の大規模データセット「MOMIJI」、および世界最大規模の言語と三次元情報を伴う自律移動データセット「STRIDE-QAデータセット」の一部も公開している。
公開されたモデルとデータセットの詳細
モデル/データセット | 詳細 | URL |
---|---|---|
Heron-NVILA-Lite-15B | 150億パラメータの日本語視覚-言語モデル | Hugging Face |
Heron-NVILA-Lite-2B | 20億パラメータの日本語視覚-言語モデル、iPhoneでローカル高速推論可能 | - |
MOMIJI | 2億4900万枚の画像URLとテキストJSONL形式のデータセット | Hugging Face |
STRIDE-QA-Mini | 3500時間超の運転データから抽出した、約10万組のQ&Aを含む自律移動データセット | Hugging Face |
スポンサーリンク
マルチモーダル大規模言語モデル(MLLMs)について
マルチモーダル大規模言語モデル(MLLMs)は、画像やテキストなど複数種類のデータを学習することで、人間のような常識や背景、文脈の理解を獲得したモデルである。このモデルは、完全自動運転の実現に不可欠な知覚・判断システムの中核を担う。
- 複数のデータソースからの学習
- 文脈理解能力の向上
- 自動運転システムへの応用
しかし、高品質な日本語MLLMsの学習データは限られており、車載実装を前提とした軽量かつ高性能なモデルの研究事例は少ないのが現状だ。
Heron-NVILA-Liteに関する考察
Heron-NVILA-Liteの公開は、日本語MLLMsの研究開発において大きな一歩となるだろう。特に、2BモデルのiPhone上でのローカル高速推論は、モバイルデバイス上でのAI活用を促進する可能性を秘めている。しかし、モデルの精度や汎用性、そしてデータセットのバイアスなどは、今後検証していく必要がある。
STRIDE-QAデータセットの公開は、自律走行AIの開発を加速させるだろう。しかし、データのプライバシーやセキュリティ、データセットの偏りといった問題への対策も重要となる。これらの課題をクリアすることで、より安全で信頼性の高い自動運転システムの開発に貢献できるだろう。
今後、より軽量で高性能なモデルの開発、そしてより多様なデータセットの公開が期待される。これらの進展によって、自動運転技術のみならず、様々な分野でのAI活用が加速していくと予想される。
参考サイト
- ^ PR TIMES. 「150億パラメータ規模で世界最高性能、日本語VLM「Heron-NVILA-Lite-15B」を公開、2BモデルはiPhone上でローカル高速推論 | Turing株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000065.000098132.html, (参照 25-05-13). 2460
- 経済産業省. https://www.meti.go.jp/index.html
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- NEDOが金属積層造形システム開発に着手、経済安全保障強化へ
- Mouser Electronics、NXPのMatter対応ワイヤレスマイクロコントローラRW612の取り扱いを開始、IoT開発を加速
- マネーツリーと鹿児島銀行が連携、Moneytree LINKで事業者向け資金管理を強化
- JVCケンウッド、特定小電力トランシーバーDEMITOSS新モデル3機種を発売 Bluetooth対応モデルもラインアップ
- ローデ・シュワルツとAnalog Devices社、車載Ethernet 10BASE-T1Sデコード技術を発表
- OmnissaがNutanix AHV対応を発表、仮想デスクトップ環境の柔軟性が向上
- DOOGEEが新型スマホN50とNote59を日本市場に投入、価格と性能のバランスに優れた2機種
- SwitchBotがマルチタスク家庭用ロボットK20+ Proを発売、家事支援機能で生活の質向上
- ソニー、BRAVIA 5シリーズとBRAVIA Theatreシリーズを発表、映画館並みの視聴体験を実現
- OBC、固定資産奉行V ERPクラウドで新リース会計基準に対応、特別版も発売
スポンサーリンク