ゲットワークスがNVIDIA GPU H200搭載サーバーの運用を開始、生成AI向け演算処理の高速化と省電力化を実現
PR TIMES より
スポンサーリンク
記事の要約
- ゲットワークスがNVIDIA GPU H200搭載サーバーの運用を開始
- 演算メモリ61GB増加とメモリ帯域幅43%向上を実現
- 検証・開発環境を企業・大学・研究機関へ提供
スポンサーリンク
NVIDIA GPU H200搭載サーバーの運用開始によりAI開発環境が強化
株式会社ゲットワークスは新潟県湯沢町の湯沢GXデータセンターにおいて、NVIDIA GPU H200搭載サーバーの運用を2024年11月25日に開始した。従来のNVIDIA GPU H100と比較して演算用メモリが61GB増加し、メモリ帯域幅が約43%向上したことで、生成AIの推論処理時間を大幅に短縮することが可能になっている。[1]
湯沢GXデータセンターでは水冷サーバーの稼働環境構築も完了しており、近日中に水冷サーバーの導入と稼働が予定されている。今回導入されたH200サーバーは空冷タイプであるが、消費電力の効率化が進んでおり、増加した演算能力に対する消費電力の増加を大きく抑制することに成功したのだ。
サーバーは1台(GPU×8枚)ごとの占有貸しまたはGPU1枚単位の共有貸しで利用可能となっており、企業や大学、研究機関などへ検証・開発環境を提供する。GPUサーバー以外にも顧客所有のストレージやネットワーク機器等を持ち込んで独自の検証環境を構築することも可能だ。
NVIDIA GPU H200搭載サーバーのスペック一覧
項目 | 詳細 |
---|---|
GPU | NVIDIA HGX H200 SXM×8(TotalMemory:1,128GB) |
CPU | AMD EPYC 9654 96Core/192Threds, 2.4GHz×2 |
メモリ | 96GB DDR5 4800MHz×24(Total 2.3TB) |
ストレージ(OS) | 1.92TB SSD×2 |
ストレージ(DATA) | 3.84TB SSD×8 |
ネットワークインターフェース | Dual port 10GbE RJ45×1 |
InfiniBand HCA | Single port NDR400 OSFP ×8 |
スポンサーリンク
メモリ帯域幅について
メモリ帯域幅とは、プロセッサとメインメモリ間でデータを転送する際の速度を表す指標であり、主な特徴として以下のような点が挙げられる。
- 1秒間に転送できるデータ量を示す重要な性能指標
- AIや機械学習の処理速度に直接影響を与える要素
- GPUの演算性能を最大限に引き出すための重要な要素
NVIDIA GPU H200ではメモリ帯域幅が従来のH100と比較して約43%向上している。この改善により生成AIにおける推論処理の高速化が実現され、より大規模なAIモデルの効率的な運用が可能になった。
NVIDIA GPU H200搭載サーバーに関する考察
NVIDIA GPU H200搭載サーバーの導入は、生成AIの開発における処理速度の向上と消費電力の効率化を両立させた点で画期的である。特にメモリ帯域幅の43%向上により、大規模言語モデルの学習や推論において従来よりも高速な処理が可能になったことは、AI開発の加速に大きく貢献するだろう。
導入されたH200サーバーは現在空冷タイプだが、今後水冷サーバーの導入も予定されている点は注目に値する。水冷システムによる冷却効率の向上は、さらなる省電力化とサーバールームの空調コスト削減につながる可能性が高いのだ。水冷サーバーの本格導入により、データセンター全体の運用効率が大きく改善されることが期待できる。
企業や研究機関へのGPU占有貸しやGPU単位での共有貸しという柔軟な利用形態の提供は、AIの実証実験や開発を促進する重要な要素となるだろう。特に独自の検証環境構築が可能な点は、多様なニーズに対応できる強みとなっている。今後はこうした環境を活用した新たなAIサービスやソリューションの創出に期待が高まる。
参考サイト
- ^ PR TIMES. 「ゲットワークス、「NVIDIA GPU H200」搭載サーバーの運用を開始。 | 株式会社ゲットワークスのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000008.000141706.html, (参照 24-11-26).
- NVIDIA. https://www.nvidia.com/ja-jp/
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Discoveryとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- MicrosoftがVSCode向けGitHub Copilot for Azureを発表、Azure開発の効率化とIDE内での完結を実現
- NTTドコモがSUPERNOVAと業務提携を開始、生成AIサービス「Stella AI」の提供でAI活用を促進
- ゼロフィールド代表がMINERS UNITED社のデータセンターを視察、GPUサーバーの米国展開強化へ向け協議
- デジタルヒューマン株式会社とNSSOLが玉置社長のデジタルヒューマンを開発、リアルタイム対話と多言語対応でDX推進に貢献
- アローリンクがLINE採用ツール「採マネnext≫」へリブランディング、1,000社突破の実績を機に採用支援を強化
- AI搭載自撮り棒が登場、アプリ不要の360度自動追尾機能とジンバルロボットで撮影の安定性が向上
- DXYZの顔認証プラットフォームFreeiDが東ティモールで初の海外導入、常石造船グループの人事システムと連携し勤怠管理の効率化を実現
- Fairy Devicesが防衛省向けにオフライン対応AI通訳装置を納入、セキュアな多言語コミュニケーションを実現
- ポーラ化成工業が暑熱対策AIカメラの実証試験結果を発表、作業員の健康管理支援に成果
- 80&CompanyとOCT-PATHが生成AI研究部門を新設し、営業支援など3つの新サービスをリリース、業務効率化を実現へ
スポンサーリンク