PFNとPFE、GENIAC第2サイクルで日本語AI開発加速へ 推論コスト1/10以下で最高性能目指す
スポンサーリンク
記事の要約
- PFNとPFE、GENIAC第2サイクル事業者に採択
- 1000億トークンの高品質データセット構築へ
- 推論コスト1/10以下で最高性能モデル開発目指す
スポンサーリンク
PFNとPFE、GENIAC第2サイクル事業者に採択され日本語AIモデル開発を加速
Preferred Networks(PFN)と子会社のPreferred Elements(PFE)は、経済産業省と新エネルギー・産業技術総合開発機構(NEDO)が実施する生成AI基盤モデル開発プロジェクト「GENIAC」の第2サイクル事業者に採択された。両社は1000億トークンの高品質データセットを大規模言語モデル(LLM)を活用して構築し、日本語最高性能のAIモデル開発を目指している。[1]
このプロジェクトでは、GENIAC第1サイクルで達成した日本語最高性能と同等もしくはそれを超える性能を、10分の1以下の推論コストで実現するLLMをフルスクラッチで開発することが目標だ。高品質な学習データを用いて最大300億パラメータモデルの事前学習と事後学習を行い、Mixture of Expert(MoE)や状態空間モデルを採用することで、利用時のアクティブパラメータを80億相当に抑える計画である。
PFNとPFEは、開発を通して取得するノウハウを部分的にテックブログ等で公開する予定だ。また、PLaMoシリーズとしてAPIやプロダクトの商用展開も視野に入れている。日本語性能に優れた世界標準の生成AI基盤モデルの開発を通じて、日本の産業のイノベーション促進と国際競争力の向上に寄与することを目指している。
GENIAC第2サイクルプロジェクトの概要
目標 | 手法 | 期待される成果 | |
---|---|---|---|
データセット | 1000億トークンの高品質データ構築 | LLMを活用した生成 | 日本語Wikipediaの約50倍規模 |
モデル開発 | 最大300億パラメータモデルの開発 | フルスクラッチ開発、MoE、状態空間モデル採用 | PLaMo-100Bと同等以上の性能 |
推論コスト | 10分の1以下に削減 | アクティブパラメータを80億相当に抑制 | 計算力と消費電力の大幅削減 |
成果展開 | ノウハウの公開と商用展開 | テックブログでの情報共有、API提供 | 日本の産業競争力向上への貢献 |
スポンサーリンク
大規模言語モデル(LLM)について
大規模言語モデル(LLM)とは、膨大な量のテキストデータを学習し、人間の言語を理解・生成できる人工知能モデルのことを指す。主な特徴として以下のような点が挙げられる。
- 大量のテキストデータから言語の規則性を学習
- 自然言語処理タスクで高い性能を発揮
- 文章生成や質問応答などの幅広いタスクに対応
LLMは学習データ量とモデルサイズの増大によって性能が向上する傾向があるが、同時に計算コストも増大する。PFNとPFEが取り組むGENIAC第2サイクルプロジェクトでは、高品質なデータセットの構築とMoEなどの効率的な手法の採用により、モデルサイズを抑えつつ高い性能を実現することを目指している。
GENIAC第2サイクルプロジェクトに関する考察
PFNとPFEによるGENIAC第2サイクルプロジェクトは、日本語AIモデル開発において画期的な取り組みだ。1000億トークンという大規模な高品質データセットの構築は、日本語処理におけるAIの性能向上に大きく寄与する可能性がある。また、推論コストを10分の1以下に抑えつつ最高性能を目指す approach は、AIの実用化と普及を加速させるだろう。
一方で、このプロジェクトには技術的な課題も存在する。300億パラメータという大規模モデルの学習には膨大な計算リソースが必要となり、開発コストの増大が懸念される。また、MoEや状態空間モデルなどの先進的な手法を採用することで、モデルの複雑性が増し、解釈性や制御性に課題が生じる可能性もある。
今後、PFNとPFEには開発過程で得られた知見の積極的な共有が期待される。日本のAI研究コミュニティ全体でノウハウを共有することで、国内のAI開発力底上げにつながるだろう。さらに、開発されたモデルのAPIやプロダクト展開を通じて、様々な産業分野でのAI活用が促進されることが期待される。
参考サイト
- ^ . 「GENIAC第2サイクルに継続採択 - 株式会社Preferred Networks」. https://www.preferred.jp/ja/news/pr20241010/, (参照 24-10-13).
- 経済産業省. https://www.meti.go.jp/index.html
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- VAE(Variational Autoencoder)とは?意味をわかりやすく簡単に解説
- UTC(協定世界時)とは?意味をわかりやすく簡単に解説
- UCB方策とは?意味をわかりやすく簡単に解説
- TWAINとは?意味をわかりやすく簡単に解説
- U-Netとは?意味をわかりやすく簡単に解説
- Transformerとは?意味をわかりやすく簡単に解説
- TPU(CloudTensorProcessingUnit)とは?意味をわかりやすく簡単に解説
- TF-IDF(Term Frequency-Inverse Document Frequency)とは?意味をわかりやすく簡単に解説
- Thunderbolt 3とは?意味をわかりやすく簡単に解説
- TensorFlowとは?意味をわかりやすく簡単に解説
- Thinkerとカワダロボティクスがキッティング作業自動化ロボットシステムを共同開発、CEATEC2024でデモンストレーション予定
- アイリックコーポレーションがFIT2024金融国際情報技術展に出展、ASシステムとSMARTロボアドLITEを披露し金融機関のDX推進に貢献
- トレードワークスとMSSが新広告プラットフォーム「toku-chain」を発表、NFT技術活用で広告効果の最大化を実現
- 株式会社ストライクが税理士向けセミナーを開催、収益力強化と人材育成のノウハウを提供
- 住信SBIネット銀行がLINE公式アカウントを開設、住宅ローン手続きのDX化を推進し顧客体験を向上
- つばさ株式会社がCEATEC 2024に出展、新サービス「spot.f」でオフィス環境に革新をもたらす
- 日本システム技術がFIT2024に「BankNeo」出展、金融機関のDX推進に向けた最新ソリューションを紹介
- チューリングがGENIAC第2期に採択、完全自動運転に向けたAI開発が加速、5.2億円規模のGPU計算資源を活用し技術革新へ
- ユニリタがデータ活用イベント「Waha! Day2024」を11月に開催、ビジネスとテクニカルの2日間構成で最新トレンドを共有
- テラチャージが山形県遊佐町の道の駅に急速充電器を導入、地方創生と防災機能の強化に貢献
スポンサーリンク