FastlyがAI Acceleratorを一般提供開始、セマンティックキャッシュ技術で生成AIの応答速度が9倍に向上

PR TIMES より
スポンサーリンク
記事の要約
- FastlyがAIソリューション「Fastly AI Accelerator」を一般提供開始
- OpenAIのChatGPTとMicrosoft Azure AI Foundryに対応
- 平均9倍のレスポンス速度向上を実現
スポンサーリンク
FastlyのAI高速化ソリューションが一般提供を開始
ファストリー株式会社は生成AIアプリケーションの高速化と最適化を実現する「Fastly AI Accelerator」を2025年1月21日に一般提供開始した。本ソリューションはLLM生成AIアプリケーションのパフォーマンス向上とコスト削減を支援するセマンティックキャッシュソリューションであり、2024年6月のベータ版リリース以降、OpenAIのChatGPTとMicrosoft Azure AI Foundryへのサポート拡大を実現している。[1]
Fastly AI Acceleratorは開発者がわずか1行のコード変更とAPIエンドポイントの更新だけでインテリジェントなセマンティックキャッシュ機能を利用できる画期的なソリューションとなっている。繰り返しのクエリに対してはFastlyのエッジクラウドプラットフォームを活用してキャッシュされたレスポンスを提供することで、パフォーマンスの大幅な向上を実現するのだ。
Fastly AI Acceleratorのベータ版を利用した全顧客データとデモトラフィックデータの分析によると、2024年10月15日から11月27日までの期間において未使用時と比較して応答速度が平均9倍に向上している。このソリューションの導入により、開発者は生成AIアプリケーションの高速化とコスト削減の両立を実現できるようになった。
Fastly AI Acceleratorの主な機能まとめ
項目 | 詳細 |
---|---|
対応サービス | OpenAI ChatGPT、Microsoft Azure AI Foundry |
導入方法 | 1行のコード変更とAPIエンドポイントの更新 |
主な特徴 | セマンティックキャッシュ機能、エッジクラウドプラットフォームの活用 |
性能向上 | 平均9倍の応答速度向上(2024年10月15日~11月27日のデータ分析結果) |
スポンサーリンク
セマンティックキャッシュについて
セマンティックキャッシュとは、AIや機械学習システムにおいて意味的に類似したクエリに対する応答をキャッシュし再利用する技術のことを指す。主な特徴として以下のような点が挙げられる。
- 意味的に同一のクエリに対する重複処理を回避
- エッジサーバーでの高速なレスポンス提供が可能
- APIコール数の削減によるコスト最適化を実現
Fastly AI Acceleratorではこのセマンティックキャッシュ技術を活用することで、個々の呼び出しごとにAIプロバイダーにアクセスする必要がなくなり応答時間を大幅に短縮している。エッジクラウドプラットフォームを活用した独自のアプローチにより、生成AIアプリケーションの効率的な運用とユーザーエクスペリエンスの向上を実現しているのだ。
参考サイト
- ^ PR TIMES. 「Fastly、初の AI ソリューション「Fastly AI Accelerator」の一般提供を開始 | ファストリー株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000057.000037639.html, (参照 25-01-21).
- Microsoft. https://www.microsoft.com/ja-jp
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- お客様に送る年度末の挨拶文の作成方法を業界別に解説
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- VGG(Visual Geometry Group)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- Watsonとは?意味をわかりやすく簡単に解説
- 【CVE-2025-21372】Windows Server 2025などで権限昇格の脆弱性、Microsoft Brokering File Systemに深刻な影響
- 【CVE-2025-21417】Windows Telephony Serviceに深刻な脆弱性、広範なバージョンのWindowsに影響
- LeanGoがマーケティングDXツールDEJAMの記事LP制作機能開発を開始、マーケター単独での記事LP制作が可能に
- commissureが法人向けハプティックデバイスFeelFuseを発表、CES 2025で触覚体験デモを実施し高評価を獲得
- アクティオがAIカメラ搭載の注意喚起システムをリリース、建設現場の安全管理が進化
- オルツREキャピタルが不動産アセットマネジメント事業を開始、AIエージェントによる効率的な資産運用サービスの提供へ
- OneboxがAIアシスタントによるメール対応代行サービスを開始、顧客対応業務の完全自動化へ向け前進
- NintがECデータ分析AIツール「Nint AI(β版)」をリリース、高度なデータ分析業務の効率化を実現
- 京急アドエンタープライズがドコモgaccoと提携し教育商材販売事業を開始、約300講座のeラーニングで企業の人材育成を支援
- エスケーエレクトロニクスがマルチピッキングカートを発表、工場や倉庫の作業効率化に貢献
スポンサーリンク