エーアイ

公開：2025-02-08

NVIDIAがDeepSeek-R1をNVIDIA NIMで提供開始、671億パラメータの大規模言語モデルが企業向けに利用可能に

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

IT・テックのコネクトメディア「ゼゼック」
カテゴリ毎のアーカイブ記事一覧
【カテゴリ別】2025年02月のアーカイブ一覧
【2025年02月】AIに関するアーカイブ一覧
【2025年02月05日】AIに関するアーカイブ一覧
NVIDIAがDeepSeek-R1をNVIDIA NIMで提供開始、671億パラメータの大規模言語モデルが企業向けに利用可能に

スポンサーリンク

関連するタグ

目次

記事の要約
NVIDIA NIMでDeepSeek-R1が利用可能に
DeepSeek-R1の主な特徴
Mixture of Expertsについて
NVIDIA NIMにおけるDeepSeek-R1提供に関する考察
参考サイト

記事の要約

NVIDIAがNVIDIA NIMでDeepSeek-R1を提供開始
単一のNVIDIA HGX H200で最大3,872トークン/秒を実現
NVIDIA AI Enterpriseの一部として提供予定

スポンサーリンク

NVIDIA NIMでDeepSeek-R1が利用可能に

NVIDIAは2025年1月30日、AI推論アプリをコンテナ形式で提供するマイクロサービスNVIDIA NIMにおいて、671億パラメータのDeepSeek-R1モデルが利用可能になったことを発表した。単一のNVIDIA HGX H200システムを通じて最大3,872トークン/秒の速度で実行できる機能が実装されており、開発者は容易にAPIを通じてサービスを展開できるようになっている。^[1]

NVIDIA NIMを通じてDeepSeek-R1を提供することで、企業は独自のインフラストラクチャ上でセキュアにモデルを実行できるようになった。NVIDIA AI FoundryとNVIDIA NeMoソフトウェアを組み合わせることで、企業は特殊なAIエージェント向けにカスタマイズされたDeepSeek-R1 NIMマイクロサービスを作成することが可能になっている。

DeepSeek-R1は各レイヤーで256個のエキスパートを持つ大規模なMixture of Experts（MoE）モデルとなっており、各トークンは8つの異なるエキスパートによって並列で評価される。NVIDIA Hopper アーキテクチャのFP8 Transformer Engineと900GB/sのNVLinkバンド幅により、MoEエキスパート間の高速な通信が実現されている。

DeepSeek-R1の主な特徴

項目	詳細
モデルサイズ	671億パラメータ
処理性能	最大3,872トークン/秒
エキスパート数	各レイヤーで256個
入力コンテキスト長	128,000トークン
主要機能	論理的推論、数学、コーディング、言語理解

スポンサーリンク

Mixture of Expertsについて

Mixture of Experts（MoE）とは、複数の専門モデル（エキスパート）を組み合わせて処理を行う機械学習アーキテクチャのことを指す。以下のような特徴を持つ革新的な手法である。

各エキスパートが特定のタスクや入力に特化した処理を担当
並列処理による高速な推論が可能
効率的なパラメータ利用による高性能化を実現

DeepSeek-R1では各レイヤーに256個のエキスパートを配置し、入力トークンを8つのエキスパートで並列評価することで高速な推論を実現している。NVIDIA NIMの最適化とNVLinkによる高速な通信機能を組み合わせることで、大規模なMoEモデルの実用的な運用が可能になっている。

NVIDIA NIMにおけるDeepSeek-R1提供に関する考察

NVIDIA NIMを通じたDeepSeek-R1の提供は、企業における大規模言語モデルの実践的な活用を促進する重要な一歩となる。セキュリティとプライバシーを確保しながら高性能な推論を実現できる点は、特に機密データを扱う企業にとって大きな価値を持つものだろう。

課題として、671億パラメータという大規模なモデルを効率的に運用するためのインフラストラクチャのコストと管理の複雑さが挙げられる。これに対してはNVIDIA AI Foundryによるカスタマイズ機能を活用し、用途に応じた最適なモデルサイズへの調整が重要になってくるだろう。

今後はMoEアーキテクチャの特性を活かした専門分野特化型のモデル開発が加速すると予想される。NVIDIA Blackwellアーキテクチャの登場により、より大規模なモデルの実用的な運用が可能になることで、AIの応用範囲がさらに広がることが期待できる。

参考サイト

^ NVIDIA. 「DeepSeek-R1 Now Live With NVIDIA NIM | NVIDIA Blog」. https://blogs.nvidia.com/blog/deepseek-r1-nim-microservice/, (参照 25-02-08).
NVIDIA. https://www.nvidia.com/ja-jp/

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム

「AI」に関するコラム一覧

「AI」に関するニュース

「AI」に関するニュース一覧

アーカイブ一覧

AIに関する人気タグ

人工知能(2396)

機械学習(2223)

ビッグデータ(752)

画像認識(546)

リアルタイム分析(100)

AIに関するカテゴリ

最新記事

WEMEXが鳥羽市の医療MaaS車両にTeladoc HEALTHを導入し地域医療の質向上へ貢献

東京都がキングサーモンプロジェクト第3弾で4社採択、テレプレゼンスやMR技術による行政DXを推進

ダイナトレックがDYNATREK BI Platform Ver. 6を発表、金融機関のDX推進に向けデータ活用基盤を強化

プツマイスタージャパンがi-Rental 点検を導入、点検業務の所要時間が半減しペーパーレス化を実現

イデアロジーが物流倉庫検索サービスア・ソコの地図機能を刷新、ハザードマップ連携で防災対策を強化

関連性が高いタグ

デジタル自動化デジタルトランスフォーメーションデジタルネイティブモダナイゼーション

プログラミング

最新記事

郁文館夢学園のロボコンチームZENSHINが世界大会FRCに向けて2025年シーズンの挑戦を開始、若手育成の強化へ

CA Tech KidsがTech Kids CAMP Spring 2025を開催、教育版マインクラフトを活用したプログラミング学習で創造性を育成

AndTechが皮脂汚れ防止の技術ウェビナーを開催、南保技術研究所の所長が最新コーティング技術を解説

UrSTUDXが2024年の先生優秀賞を発表、306名の先生から6部門で受賞者を選出し教育プラットフォームの発展に貢献

NPO法人プログラミング教育研究所が東京プログラミングコンテスト2024を開催し238名が来場、50作品の展示と表彰を実施

関連性が高いタグ

開発リリース言語テストオープンソース

最新記事

アイテック阪急阪神のi-COMonSがMEEQ SIMを採用、閉域網による安全な通信環境と運用効率化を実現

アンリツのMT8870AがSamsung Electronics Galaxy S25の量産試験に採用、非地上系ネットワーク通信の品質向上に貢献

LIXILとショウタイム24がIoTホームリンクLife Assist2で連携、無人内見システムの遠隔操作機能が大幅に向上

アークエルとABBがEV充電システムの連係を発表、スマート充電と運行管理の効率化を実現

コクヨが大人向けIoT文具『大人のやる気ペン』をMakuakeで先行販売、努力の見える化で学習習慣の定着をサポート

関連性が高いタグ

ウェアラブルエッジコンピューティングスマートシティGPSスマートホーム

コンピュータ

最新記事

鹿島建設が鉄骨梁端部の接合部を合理化する鹿島式ストレート梁工法を開発、品質と生産性の向上を実現

LIFULL ArchiTechが名古屋市立瑞穂ケ丘中学校でインスタントハウスを活用した探究学習プログラムを実施、防災意識向上と技術革新への理解を促進

日産自動車がNetApp Keystoneを導入、マルチクラウドによるHPCシミュレーション環境の最適化を実現

MicrosoftがAzure SQL DatabaseのChange Event Streamingプレビューを開始、リアルタイムデータ連携基盤の構築が容易に

AndTechが先端パッケージ基板開発のウェビナーを2025年2月に開催、次世代通信技術の最新動向を解説

関連性が高いタグ

システムデータプラットフォームネットワーククラウド

スポンサーリンク

ブログに戻る

ALL

トピックス

2025年 5月 29日

R/GAと富士通の「Carbon Cakes」がCreative Review Annual Awardsで「Creative Use of Data」賞を受賞

2025年 5月 29日

株式会社ソフィアが新規事業提案制度に関する無料オンラインセミナーを5月29日に開催

2025年 5月 29日

株式会社HATARABAがプロパティマネジメント事業を開始、ビルオーナーの収益最大化を支援

2025年 5月 29日

三井屋工業と鳥取大学、リサイクル培地「ふわっ土」の共同研究開始で農業分野進出加速

2025年 5月 29日

イシン株式会社が公務員向けキャリアセミナーを開催、元公務員3名が経験を語る

2025年5月29日

R/GAと富士通の「Carbon Cakes」がCreative Review Annual Awardsで「Creative Use of Data」賞を受賞

2025年5月29日

株式会社ソフィアが新規事業提案制度に関する無料オンラインセミナーを5月29日に開催

2025年5月29日

株式会社HATARABAがプロパティマネジメント事業を開始、ビルオーナーの収益最大化を支援

2025年5月29日

三井屋工業と鳥取大学、リサイクル培地「ふわっ土」の共同研究開始で農業分野進出加速

2025年5月29日

イシン株式会社が公務員向けキャリアセミナーを開催、元公務員3名が経験を語る