アクセルとインテルがailia SDKで協力、XMX活用で高速AI推論の処理速度が40%向上
PR TIMES より
スポンサーリンク
記事の要約
- アクセルとインテルがailia SDKで高速AI推論の協力を発表
- Intel XMXによってRAGでの処理速度が40%向上
- ailia DX Insightが将来のリリースでXMXをサポート予定
スポンサーリンク
アクセルとインテルのailia SDKによる高速AI推論の実現
アクセルとインテルは、アクセルとそのグループ会社axが開発したAIフレームワークailia SDKを使用した高速AI推論に関するコラボレーションを2024年12月23日に発表した。ailia SDKはクロスプラットフォームフレームワークとして設計され、エッジデバイス上でAIを実行することで安定性の向上と低遅延を実現している。[1]
インテルとの協力により、ailia SDKはIntel Arc GPUとIntel Core Ultraプロセッサ用のIntel Xe Matrix Extensions(XMX)を使用した高速推論をサポートするようになった。XMX AIエンジンはailia SDKのVulkanバックエンドに推論ワークロードの専用アクセラレーションを提供することで、パフォーマンスの大幅な向上を実現している。
RAGでの文書登録の評価では、Intel Arc A770 GPUでXMXを有効にすることで処理時間が304.5ミリ秒から184.25ミリ秒に短縮され、40%のパフォーマンス向上が確認された。アクセルのDXアプリケーションであるailia DX Insightも将来のリリースでXMXをサポートする予定になっている。
ailia SDKのXMXサポートによる性能向上まとめ
項目 | 詳細 |
---|---|
対応プロセッサ | Intel Arc GPU、Intel Core Ultraプロセッサ(シリーズ2) |
XMX有効時の処理時間 | 184.25ミリ秒 |
XMX無効時の処理時間 | 304.5ミリ秒 |
性能向上率 | 40% |
今後の展開 | ailia DX InsightでのXMXサポート予定 |
スポンサーリンク
XMXについて
XMXとはIntel Xe Matrix Extensionsの略称で、IntelのGPUアーキテクチャに組み込まれた行列演算に特化した専用AIアクセラレーション技術のことを指す。主な特徴として、以下のような点が挙げられる。
- GPUのXeコア内に構築された専用AIエンジン
- 行列乗算の高速処理に特化した設計
- トランスフォーマーモデルの処理を効率的に実行
XMXは従来のGPU処理と比較して、AI推論ワークロードに対して大幅なパフォーマンス向上を実現することが可能だ。ailia SDKにおいてもXMXを活用することで、RAGでの文書登録処理時間を40%短縮するなど、実用的な性能改善が確認されている。
ailia SDKのXMXサポートに関する考察
ailia SDKがXMXをサポートすることで、エッジデバイスでのAI処理における新たな可能性が広がることが期待できる。特にRAGでの文書登録処理時間が40%短縮されたことは、リアルタイム性が求められるエッジAIアプリケーションの実用化を大きく後押しするだろう。
今後の課題として、XMXに最適化されていないAIモデルへの対応や、異なるハードウェアプラットフォームでの性能最適化が挙げられる。これらの課題に対しては、AIモデルの最適化ツールの提供や、プラットフォーム固有の機能を活用するためのAPIの整備が有効な解決策となるだろう。
将来的には、ailia SDKを活用したエッジAIアプリケーションの普及が期待される。特にailia DX InsightがXMXをサポートすることで、ビジネス向けAIソリューションの性能向上と導入コストの削減が実現できるはずだ。今後のアクセルとインテルの協力関係の発展にも注目が集まる。
参考サイト
- ^ PR TIMES. 「アクセルとインテルがailia SDKを使用した高速AI推論で協力 | 株式会社アクセルのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000077.000004053.html, (参照 24-12-24).
- Intel. https://www.intel.co.jp/content/www/jp/ja/homepage.html
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Discoveryとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- ラクスがAIクレーム検知と自動応答機能を活用したカスハラ対策セミナーを発表、従業員の心身の安全確保と顧客満足度向上を実現
- ファインディが生成AI活用のエンジニアおみくじ2025を発表、運勢パターンが約18万通りに拡大へ
- 合同会社Opt.devが月額制Studio特化型コミュニティノーコードサロンを日本初リリース、デジタルスキル向上に期待
- MILIZEとTENTOが金融教育×プログラミングのワークショップ開催、2024年12月から年間24回の教育プログラムを展開
- 株式会社商談プロが次世代営業リストツールのβ版フリートライアルを2025年1月に提供開始、AIとインテントセールスで営業改革を加速
- BAKERUがショーケースのProTech ID Checkerを導入、Z世代向けSIMサービスの本人確認プロセスをDX化して業務効率を向上
- プロディライトがINNOVERA 2.0の新機能を公開、チュートリアル機能とお知らせ機能の実装でユーザビリティが向上
- GalirageとロートがRAG精度改善コンペを開催、製薬業界向け文書処理の技術革新を推進
- TD SYNNEXがIBM watsonx搭載アプライアンスサーバーを提供開始、オンプレミスでの生成AI開発環境の構築が容易に
- 江崎グリコとコカ・コーラボトラーズジャパンが物流効率化で環境負荷削減、グリーン物流優良事業者表彰を受賞
スポンサーリンク