公開:

NVIDIAがDeepSeek-R1をNVIDIA NIMで提供開始、671億パラメータの大規模言語モデルが企業向けに利用可能に

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • NVIDIAがNVIDIA NIMでDeepSeek-R1を提供開始
  • 単一のNVIDIA HGX H200で最大3,872トークン/秒を実現
  • NVIDIA AI Enterpriseの一部として提供予定

NVIDIA NIMでDeepSeek-R1が利用可能に

NVIDIAは2025年1月30日、AI推論アプリをコンテナ形式で提供するマイクロサービスNVIDIA NIMにおいて、671億パラメータのDeepSeek-R1モデルが利用可能になったことを発表した。単一のNVIDIA HGX H200システムを通じて最大3,872トークン/秒の速度で実行できる機能が実装されており、開発者は容易にAPIを通じてサービスを展開できるようになっている。[1]

NVIDIA NIMを通じてDeepSeek-R1を提供することで、企業は独自のインフラストラクチャ上でセキュアにモデルを実行できるようになった。NVIDIA AI FoundryとNVIDIA NeMoソフトウェアを組み合わせることで、企業は特殊なAIエージェント向けにカスタマイズされたDeepSeek-R1 NIMマイクロサービスを作成することが可能になっている。

DeepSeek-R1は各レイヤーで256個のエキスパートを持つ大規模なMixture of Experts(MoE)モデルとなっており、各トークンは8つの異なるエキスパートによって並列で評価される。NVIDIA Hopper アーキテクチャのFP8 Transformer Engineと900GB/sのNVLinkバンド幅により、MoEエキスパート間の高速な通信が実現されている。

DeepSeek-R1の主な特徴

項目 詳細
モデルサイズ 671億パラメータ
処理性能 最大3,872トークン/秒
エキスパート数 各レイヤーで256個
入力コンテキスト長 128,000トークン
主要機能 論理的推論、数学、コーディング、言語理解

Mixture of Expertsについて

Mixture of Experts(MoE)とは、複数の専門モデル(エキスパート)を組み合わせて処理を行う機械学習アーキテクチャのことを指す。以下のような特徴を持つ革新的な手法である。

  • 各エキスパートが特定のタスクや入力に特化した処理を担当
  • 並列処理による高速な推論が可能
  • 効率的なパラメータ利用による高性能化を実現

DeepSeek-R1では各レイヤーに256個のエキスパートを配置し、入力トークンを8つのエキスパートで並列評価することで高速な推論を実現している。NVIDIA NIMの最適化とNVLinkによる高速な通信機能を組み合わせることで、大規模なMoEモデルの実用的な運用が可能になっている。

NVIDIA NIMにおけるDeepSeek-R1提供に関する考察

NVIDIA NIMを通じたDeepSeek-R1の提供は、企業における大規模言語モデルの実践的な活用を促進する重要な一歩となる。セキュリティとプライバシーを確保しながら高性能な推論を実現できる点は、特に機密データを扱う企業にとって大きな価値を持つものだろう。

課題として、671億パラメータという大規模なモデルを効率的に運用するためのインフラストラクチャのコストと管理の複雑さが挙げられる。これに対してはNVIDIA AI Foundryによるカスタマイズ機能を活用し、用途に応じた最適なモデルサイズへの調整が重要になってくるだろう。

今後はMoEアーキテクチャの特性を活かした専門分野特化型のモデル開発が加速すると予想される。NVIDIA Blackwellアーキテクチャの登場により、より大規模なモデルの実用的な運用が可能になることで、AIの応用範囲がさらに広がることが期待できる。

参考サイト

  1. ^ NVIDIA. 「DeepSeek-R1 Now Live With NVIDIA NIM | NVIDIA Blog」. https://blogs.nvidia.com/blog/deepseek-r1-nim-microservice/, (参照 25-02-08).
  2. NVIDIA. https://www.nvidia.com/ja-jp/

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。