野村総合研究所が80億パラメーターの小規模LLMで業界特化型モデルを開発、GPT-4oを上回る性能を実現
スポンサーリンク
記事の要約
- NRIが業界・タスク特化型LLMの構築手法を開発
- 80億パラメーターの小規模モデルでGPT-4oを上回る性能を実現
- 保険業界のコンプライアンスチェックで86.3%の正解率を達成
スポンサーリンク
NRIが独自開発した業界特化型LLMが高精度を実現
株式会社野村総合研究所は2025年4月15日、独自の技術とノウハウを活用し、80億パラメーターの比較的小規模なモデルをベースにした業界・タスク特化型LLMの構築手法を開発したと発表した。東京科学大学と産業技術総合研究所の「Llama 3.1 Swallow 8B」をベースモデルとして採用し、計算リソースと運用コストの削減を実現している。[1]
NRIの独自特化型モデルは、継続事前学習による業界知識の適応とファインチューニングによるタスク最適化を組み合わせることで、保険業界の営業コンプライアンスチェックにおいてGPT-4oを9.6ポイント上回る86.3%の正解率を達成した。この手法はオープンウェイトのLLMを基盤としており、目的やタスクに応じて柔軟なモデル選定が可能となっている。
今後のビジネス展開として、NRIは2025年度に東京科学大学岡崎研究室との共同研究を予定しており、具体的な業界課題を反映した実証実験やモデル技術の改良を進める方針だ。さらにビッグテック企業やスタートアップとの連携も強化し、多様な業界での活用拡大を目指している。
業界特化型LLMの性能評価まとめ
GPT-4o | ベースモデル | NRI特化型(FT) | NRI特化型(CPT+FT) | |
---|---|---|---|---|
正解率 | 76.7% | 51.7% | 83.1% | 86.3% |
モデルサイズ | 大規模 | 80億パラメータ | 80億パラメータ | 80億パラメータ |
特徴 | 汎用性重視 | 日本語性能重視 | タスク特化 | 業界知識融合 |
スポンサーリンク
継続事前学習について
継続事前学習とは、既に一般的な知識を持つ事前学習済みモデルに対し、新たな領域やタスクに合わせた追加データでさらに学習させ、専門性や適応性を向上させる手法のことを指す。主な特徴として以下のような点が挙げられる。
- 既存の言語能力や知識を維持しながら専門知識を習得
- 業界特有の用語や規制に関する理解を深化
- 特定分野における精度向上を効率的に実現
NRIの業界・タスク特化型LLMでは、銀行・保険等の金融業界向けに日本語金融コーパスを独自に構築し継続事前学習を実施している。この手法により、ベースモデルの一般的な言語能力を維持しつつ、業界特有の専門的知識を効果的に習得させることに成功している。
参考サイト
- ^ 株式会社野村総合研究所. 「野村総合研究所、業界・タスク特化型LLMの構築手法を独自に開発 | ニュースリリース | 野村総合研究所(NRI)」. https://www.nri.com/jp/news/newsrelease/20250415_1.html, (参照 25-04-16). 2746
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- GoogleがDocsのコードブロック機能を拡張、C#やGoなど14言語に新対応し開発者の利便性が向上
- GoogleがClassroomにGemini問題生成機能を追加、教育者の作業効率向上とデジタル教育の進化に貢献
- MicrosoftがWindows 11 Insider Preview Build 22635.5235を公開、File ExplorerとSettingsの改善でユーザビリティが向上
- GitHubがSub-Issues機能を正式リリース、階層的なタスク管理による開発効率の向上を実現
- AWSがAmazon Q Developerで日本語サポートを開始、開発者の言語バリアを解消しシステム開発の効率化を促進
- システムインテグレータが製造業向けAIエージェント事業を開始、既存システムを活かした業務改革を促進
- IllumioがAIセキュリティグラフ搭載のIllumio Insightsを発表、クラウド環境のセキュリティ監視が進化
- カルクワークスが無制限のディープ検索AI機能を搭載、中小企業の業務効率化を強力に支援
- 森未来が1万点超の木材情報を一元化する総合データベースを運用開始、建材選定の効率化に貢献
- シームレステクノロジーが車両盗難防止システムZ-GUARDを発売、スマートフォン連動で最新の盗難手口に完全対応
スポンサーリンク