AkamaiがCloud Inferenceを発表、エッジでのAI推論処理で従来比3倍のスループット向上を実現

PR TIMES より
スポンサーリンク
記事の要約
- AkamaiがCloud Inferenceを発表、AI推論処理を効率化
- 従来比でスループット3倍向上、レイテンシー60%削減を実現
- コスト86%削減とエッジでの高性能処理を両立
スポンサーリンク
Akamai Cloud Inferenceが実現する次世代AI基盤
Akamai Technologiesは2025年3月27日、エッジでのAI推論処理に特化したAkamai Cloud Inferenceを発表した。世界130か国以上で展開する4,200以上の接続点を活用し、従来のハイパースケーラーと比較してスループットが3倍に向上し、レイテンシーを60%削減することが可能になっている。[1]
Akamai Cloud Inferenceは、CPUによるファインチューニングされた推論からGPUによる高速コンピューティング、ASIC VPUまで多様な処理オプションを提供している。NVIDIAのAI Enterpriseエコシステムと統合することで、GPU上でのAI推論パフォーマンスを最適化することが実現した。
さらにVAST Dataとの提携により、リアルタイムデータへのアクセスを合理化し推論関連タスクを高速化している。Aivenやミルバスなどの主要なベクトルデータベースベンダーとの統合により、検索拡張生成(RAG)にも対応し、低レイテンシーのAI推論をグローバル規模で展開することが可能だ。
Akamai Cloud Inferenceの主要機能まとめ
コンピューティング | データ管理 | コンテナ化 | エッジコンピューティング | |
---|---|---|---|---|
主な特徴 | 多様な処理オプション | 最先端データファブリック | Kubernetes活用 | WebAssembly対応 |
パートナー | NVIDIA | VAST Data | LKE Enterprise | Fermyon |
メリット | 処理性能の最適化 | データアクセス高速化 | 自動スケーリング | レイテンシー削減 |
スポンサーリンク
LLMについて
LLMとは「Large Language Model(大規模言語モデル)」の略称で、自然言語処理に特化した人工知能モデルのことを指す。主な特徴として、以下のような点が挙げられる。
- 要約や翻訳、カスタマーサービスなどの汎用タスクに優れた性能を発揮
- 大規模なデータセットを用いた学習により、高度な言語理解が可能
- トレーニングには多大なコストと時間を要するが、推論処理は効率化が可能
Akamai Cloud Inferenceは、LLMの実用的な推論処理をエッジで実行することで、高いパフォーマンスと低コストを両立している。従来のクラウドモデルにおける制約を克服し、より迅速かつ効率的なAIアプリケーションの展開を可能にすることが期待される。
Akamai Cloud Inferenceに関する考察
Akamai Cloud Inferenceが実現するエッジでのAI推論処理は、今後のAIアプリケーション開発において重要な転換点となる可能性がある。従来のクラウドモデルでは対応が困難だったリアルタイム性の高いAIサービスの実現が可能になり、車載音声アシスタンスや画像最適化など、新たなユースケースの創出が期待できるだろう。
一方で、エッジコンピューティングの特性上、全ての処理をエッジで完結させることは難しく、中央のデータセンターとの適切な役割分担が課題となる。特にモデルの更新やデータの同期において、効率的な運用手法の確立が必要になってくるだろう。
今後はWebAssemblyなどの新技術との組み合わせにより、さらなる性能向上や用途拡大が見込まれる。エッジAIの実用化が加速することで、より身近な場面でAIサービスが活用されるようになることが期待される。
参考サイト
- ^ PR TIMES. 「Akamai、Akamai Cloud Inference により AI 分野での競争力を強化 | アカマイ・テクノロジーズ合同会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000243.000031697.html, (参照 25-04-09). 4964
- NVIDIA. https://www.nvidia.com/ja-jp/
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- VGG(Visual Geometry Group)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- Watsonとは?意味をわかりやすく簡単に解説
- Watson Assistantとは?意味をわかりやすく簡単に解説
- 【CVE-2025-3332】codeprojects Restaurant Management Systemに深刻な脆弱性、SQLインジェクション攻撃の危険性が明らかに
- 【CVE-2025-3069】Google Chrome拡張機能に権限昇格の脆弱性、135.0.7049.52で修正完了
- GoogleがHelp me write機能の対応言語を拡大、日本語を含む4言語が新たに追加され業務効率化を促進
- GoogleがGmailのHelp me write機能を日本語と韓国語に対応、ビジネスコミュニケーションの効率化を促進
- Semantic Kernel AgentsがバージョンV1.45で正式リリース、AIアプリケーション開発の効率化を実現
- Visual Studio CodeのPython拡張機能がアップデート、CopilotとNotebookの連携強化で開発効率が向上
- SQL ServerとAzure SQLがHybrid Search機能を強化、BM25とベクトル検索の統合で検索精度が向上
- Windows 11 Insider Preview Build 22635.5170がBetaチャネルで公開、File Explorerの使い勝手が向上
- GitHubがCopilotコードレビューを正式リリース、生成AI活用で開発効率が飛躍的に向上へ
- キューブシステムがファイテンの仮想共通基盤環境をクラウド化、システム停止時間を最小限に抑えた大規模移行を実現
スポンサーリンク