Alibaba CloudがAIモデルQwen2.5-Maxを発表、MoEアーキテクチャ採用で高性能を実現

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

IT・テックのコネクトメディア「ゼゼック」
カテゴリ毎のアーカイブ記事一覧
【カテゴリ別】2025年02月のアーカイブ一覧
Alibaba CloudがAIモデルQwen2.5-Maxを発表、MoEアーキテクチャ採用で高性能を実現

記事の要約
Alibaba CloudのQwen2.5-Max AIモデルがベンチマークテストで高評価
Qwen2.5-Maxの性能評価まとめ
Mixture-of-Expert（MoE）モデルについて
Qwen2.5-Maxに関する考察
参考サイト

記事の要約

Alibaba CloudがAIモデルQwen2.5-Maxを発表
20兆以上のトークンで事前学習を実施
APIをAlibaba Cloud Model Studioで提供開始

Alibaba CloudのQwen2.5-Max AIモデルがベンチマークテストで高評価

中国アリババグループのAlibaba Cloudは2025年1月28日、大規模なMixture-of-Expert（MoE）モデルであるQwen2.5-Maxを発表した。20兆以上のトークンで事前学習を行い、Supervised Fine-Tuning（SFT）とReinforcement Learning from Human Feedback（RLHF）による追加学習も実施している。^[1]

Qwen2.5-MaxはDeepSeek V3やGPT-4o、Claude-3.5-Sonnetなどの最先端モデルとの比較評価において、Arena-Hard、LiveBench、LiveCodeBenchなどの多くのベンチマークで優れた性能を示している。特にGPQA-Diamondではトップクラスの成績を収めており、MMLU-Proでも競争力のある結果を残すことに成功した。

Alibaba CloudはQwen2.5-MaxのAPIをModel Studioサービスを通じて提供開始しており、OpenAI互換のAPIとして実装されている。開発者はAlibaba Cloudアカウントを作成してModel Studioサービスを有効化し、コンソールからAPIキーを取得することで、Pythonなどのプログラミング言語からモデルを利用することが可能となっている。

Qwen2.5-Maxの性能評価まとめ

	Arena-Hard	LiveBench	LiveCodeBench	MMLU-Pro
比較対象	DeepSeek V3	DeepSeek V3	DeepSeek V3	DeepSeek V3
評価結果	優位性あり	優位性あり	優位性あり	競争力あり

Mixture-of-Expert（MoE）モデルについて

Mixture-of-Expert（MoE）モデルとは、複数の専門家モデル（Expert）を組み合わせて、タスクに応じて最適なモデルを選択する機械学習アーキテクチャのことを指す。主な特徴として以下のような点が挙げられる。

タスクごとに専門化された複数のニューラルネットワークを統合
効率的なパラメータ活用による計算リソースの最適化
スケーラビリティの高い分散学習アーキテクチャ

Qwen2.5-MaxではMoEアーキテクチャを採用することで、20兆トークンという大規模なデータセットでの事前学習を実現している。従来の密なモデル構造と比較して、MoEモデルは効率的にパラメータを活用することができ、より大規模なモデルの学習と運用が可能となっている。

Qwen2.5-Maxに関する考察

Qwen2.5-MaxのAPIがOpenAI互換として提供されることは、既存のAIアプリケーション開発者にとって大きなメリットとなるだろう。開発者は最小限のコード変更でQwen2.5-Maxを既存のシステムに組み込むことができ、新たな学習コストを抑えながら高性能なAIモデルを利用することが可能となっている。

今後の課題として、MoEモデルの運用コストと計算リソースの最適化が挙げられる。複数の専門家モデルを効率的に管理し、必要な計算リソースを適切に配分することが、サービスの安定性と拡張性を確保する上で重要となるだろう。APIの安定性や応答速度の維持も、実用化に向けた重要な課題となっている。

将来的にはMoEモデルの特性を活かした専門分野特化型のAIサービスの展開も期待される。医療や金融、法務など、高度な専門知識が必要な分野において、各分野に特化した専門家モデルを効果的に活用することで、より精度の高いAIソリューションを提供できる可能性がある。

参考サイト

^ GitHub. 「Qwen2.5-Max: Exploring the Intelligence of Large-scale MoE Model | Qwen」. https://qwenlm.github.io/blog/qwen2.5-max/, (参照 25-02-01).
Alibaba. https://www.alibaba.co.jp/

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム