公開:

野村総合研究所が80億パラメーターの小規模LLMで業界特化型モデルを開発、GPT-4oを上回る性能を実現

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • NRIが業界・タスク特化型LLMの構築手法を開発
  • 80億パラメーターの小規模モデルでGPT-4oを上回る性能を実現
  • 保険業界のコンプライアンスチェックで86.3%の正解率を達成

NRIが独自開発した業界特化型LLMが高精度を実現

株式会社野村総合研究所は2025年4月15日、独自の技術とノウハウを活用し、80億パラメーターの比較的小規模なモデルをベースにした業界・タスク特化型LLMの構築手法を開発したと発表した。東京科学大学と産業技術総合研究所の「Llama 3.1 Swallow 8B」をベースモデルとして採用し、計算リソースと運用コストの削減を実現している。[1]

NRIの独自特化型モデルは、継続事前学習による業界知識の適応とファインチューニングによるタスク最適化を組み合わせることで、保険業界の営業コンプライアンスチェックにおいてGPT-4oを9.6ポイント上回る86.3%の正解率を達成した。この手法はオープンウェイトのLLMを基盤としており、目的やタスクに応じて柔軟なモデル選定が可能となっている。

今後のビジネス展開として、NRIは2025年度に東京科学大学岡崎研究室との共同研究を予定しており、具体的な業界課題を反映した実証実験やモデル技術の改良を進める方針だ。さらにビッグテック企業やスタートアップとの連携も強化し、多様な業界での活用拡大を目指している。

業界特化型LLMの性能評価まとめ

GPT-4o ベースモデル NRI特化型(FT) NRI特化型(CPT+FT)
正解率 76.7% 51.7% 83.1% 86.3%
モデルサイズ 大規模 80億パラメータ 80億パラメータ 80億パラメータ
特徴 汎用性重視 日本語性能重視 タスク特化 業界知識融合

継続事前学習について

継続事前学習とは、既に一般的な知識を持つ事前学習済みモデルに対し、新たな領域やタスクに合わせた追加データでさらに学習させ、専門性や適応性を向上させる手法のことを指す。主な特徴として以下のような点が挙げられる。

  • 既存の言語能力や知識を維持しながら専門知識を習得
  • 業界特有の用語や規制に関する理解を深化
  • 特定分野における精度向上を効率的に実現

NRIの業界・タスク特化型LLMでは、銀行・保険等の金融業界向けに日本語金融コーパスを独自に構築し継続事前学習を実施している。この手法により、ベースモデルの一般的な言語能力を維持しつつ、業界特有の専門的知識を効果的に習得させることに成功している。

参考サイト

  1. ^ 株式会社野村総合研究所. 「野村総合研究所、業界・タスク特化型LLMの構築手法を独自に開発 | ニュースリリース | 野村総合研究所(NRI)」. https://www.nri.com/jp/news/newsrelease/20250415_1.html, (参照 25-04-16).
  2. 2746

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。