リッジアイとジーデップ・アドバンスがローカルRAGスターターBOXを共同開発、オンプレミス環境でのLLM開発が容易に
スポンサーリンク
記事の要約
- リッジアイとジーデップ・アドバンスが共同開発システムを発表
- ローカルRAGスターターBOXの受注開始
- オンプレミス環境でのLLM開発を実現
スポンサーリンク
リッジアイとジーデップ・アドバンスが共同開発したローカルRAGスターターBOXの詳細
リッジアイとジーデップ・アドバンスは2025年1月20日、オンプレミス環境でユーザー固有の文書やデータを活用したRAGを実装することで、より手軽・迅速・安全な大規模言語モデル開発を可能にするシステム「ローカルRAGスターターBOX」を共同開発し受注を開始した。国内トップクラスのNVIDIA GPU搭載システムの販売実績を持つジーデップ・アドバンスとAI開発実績を誇るリッジアイの技術力を結集したシステムとなっている。[1]
ローカルRAGスターターBOXは、LLMとRAGの研究開発に最適なハードウェアとライブラリを予め用意しており、クラウド接続が不要なローカル環境上でのLLMの利用やユーザー固有の文書やデータを活用したRAGの実装をすぐに開始できる。リッジアイのAI開発に関するQ&Aが利用できるバウチャーチケットも付属している。
GPUにはNVIDIA Ada Lovelaceアーキテクチャを採用したRTX Adaシリーズを搭載し、最大48GBのGDDR6メモリと広帯域なNVLINKを組み合わせることで高いAI学習性能および推論性能を実現している。開発環境にはDify OpenWebUIとOllama Xinferenceを実装し、AIモデルには2024年に発表されたLlama 3.1をはじめとした複数のモデルをプリインストールしている。
ローカルRAGスターターBOXのラインナップ
エントリーモデル | スタンダードモデル | ハイスペックモデル | |
---|---|---|---|
価格(税抜) | 1,998,000円 | 2,788,000円 | 4,678,000円 |
CPU | Xeon w5-2555X | Xeon w5-3535X | Xeon w5-3535X |
GPU | RTX 4500 Ada 24GB | RTX 6000Ada 48GB | RTX 6000Ada 48GB×3 |
スポンサーリンク
RAGについて
RAGとはRetrieval-Augmented Generationの略称で、LLMに正確で最新の情報が格納されたデータを読み込ませることで、特定のニーズや専門性に対応させたり、ハルシネーション(事実に基づかない情報が生成される事象)を抑制する技術のことを指す。主な特徴として以下のような点が挙げられる。
- 正確で最新の情報をモデルに提供可能
- 特定のニーズや専門性への対応が容易
- ハルシネーションの抑制に効果的
企業や研究機関が保有する機密性の高い学習データをイントラから外に出すことなくRAGを運用できることが重要な課題となっている。ローカルRAGスターターBOXは、セキュアな環境でRAGを実装することで、より安全で効率的なLLM開発を実現している。
ローカルRAGスターターBOXに関する考察
ローカルRAGスターターBOXの最大の利点は、機密性の高いデータを外部に出すことなくLLM開発が可能な点である。企業や研究機関にとって、データセキュリティを確保しながら最新のAI技術を活用できる環境が整備されたことは大きな前進といえるだろう。
今後の課題として、ハードウェアの性能向上に伴うコストの増加や、より複雑なAIモデルへの対応が考えられる。解決策としては、モジュール化された設計によるハードウェアの段階的なアップグレードや、効率的なモデル最適化技術の導入が有効かもしれない。
将来的には、より多様な業界特化型のRAGモデルの開発や、企業間でのナレッジ共有を可能にするセキュアな連携機能の実装が期待される。オンプレミス環境でのAI開発基盤として、産業界全体のDX推進に貢献する可能性を秘めている。
参考サイト
- ^ 株式会社Ridge-i. 「AI・ディープラーニング技術開発のリッジアイとAI ソリューションプロバイダのジーデップ・アドバンス、LLM 開発システム「ローカル RAG スターターBOX」を共同開発・受注開始」. https://ridge-i.com/cms/wp-content/uploads/2025/01/%E2%96%A0PR_250117_AI%E3%83%BB%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0%E6%8A%80%E8%A1%93%E9%96%8B%E7%99%BA%E3%81%AE%E3%83%AA%E3%83%83%E3%82%B8%E3%82%A2%E3%82%A4%E3%81%A8AI%E3%82%BD%E3%83%AA%E3%83%A5%E3%83%BC%E3%82%B7%E3%83%A7%E3%83%B3%E3%83%97%E3%83%AD%E3%83%90%E3%82%A4%E3%83%80%E3%81%AE%E3%82%B8%E3%83%BC%E3%83%87%E3%83%83%E3%83%97%E3%83%BB%E3%82%A2%E3%83%89%E3%83%90%E3%83%B3%E3%82%B9%E3%80%81LLM%E9%96%8B%E7%99%BA%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0%E3%80%8C%E3%83%AD%E3%83%BC%E3%82%AB%E3%83%ABRAG%E3%82%B9%E3%82%BF%E3%83%BC%E3%82%BF%E3%83%BCBOX%E3%80%8D%E3%82%92%E5%85%B1%E5%90%8C%E9%96%8B%E7%99%BA%E3%83%BB%E5%8F%97%E6%B3%A8%E9%96%8B%E5%A7%8B.pdf, (参照 25-01-22).
- NVIDIA. https://www.nvidia.com/ja-jp/
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- VGG(Visual Geometry Group)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- Watsonとは?意味をわかりやすく簡単に解説
- Watson Assistantとは?意味をわかりやすく簡単に解説
- 【CVE-2025-21136】Substance3D - Designerに深刻な脆弱性、任意コード実行のリスクで早急な対応が必要
- 【CVE-2025-21362】Microsoft Excelに深刻な脆弱性、Office製品群に広範な影響
- 【CVE-2025-21395】Microsoft AccessにHeap-based Buffer Overflow脆弱性、複数バージョンで更新プログラムの適用が必要に
- 【CVE-2025-21365】Microsoft Office製品にリモートコード実行の脆弱性、32-bitおよびx64システムに影響
- FastlyがAI Acceleratorを正式リリース、セマンティックキャッシュでAIアプリケーションの高速化とコスト削減を実現
- Windows 11 Build 26100.3025が公開、タスクバープレビューとNPU対応機能が強化されユーザビリティが向上
- Meta Heroesが2025年大阪関西万博で防災万博を開催、メタバースとAIを活用した新たな防災ソリューションを展開へ
- 有限会社コバレントが笹塚みらいDXエデュラボを開始、DXとAI活用による業務効率化を支援
- TopKnot社がDX研修サービス道玄坂みらいDXエデュラボを開始、企業のDX推進と地方創生の実現へ
- AVILENが高精度な帳票処理AIエージェントをリリース、特殊レイアウトの読み取りと基幹システムへの自動登録を実現
スポンサーリンク