公開:

MicrosoftがPhi-4の推論機能を強化した3つの小規模言語モデルを公開、高度な数理解析が可能に

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • Microsoftが3つの推論強化モデルをリリース
  • Phi-4-reasoningシリーズが高度な推論能力を実現
  • 小規模モデルで大規模モデル並みの性能を達成

MicrosoftがPhi-4の推論能力を強化した新モデルを公開

Microsoftは2024年12月に公開したPhi-4の推論能力を強化した小規模言語モデル「Phi-4-reasoning」「Phi-4-reasoning-plus」「Phi-4-mini-reasoning」の3モデルを公開した。OpenAI o3-miniによる高品質な推論データを用いた教師ありファインチューニングによって訓練され、詳細な推論過程の生成が可能になっている。[1]

Phi-4-reasoningは140億パラメータのオープンモデルで、数学や科学、コーディングなど多様な分野の推論タスクにおいて大規模言語モデルに匹敵する性能を発揮する。Phi-4-reasoning-plusは強化学習によって追加の推論時計算リソースを活用できるよう訓練され、Phi-4-reasoningの1.5倍のトークンを使用することで高い精度を実現している。

Phi-4-mini-reasoningは38億パラメータの軽量モデルながら、計算資源や遅延が限られた環境でも高品質な数理推論を提供する。Deepseek-R1モデルが生成した合成データでファインチューニングされており、効率性と高度な推論能力のバランスを実現している。

Phi-4-reasoningシリーズの性能比較

Phi-4-reasoning Phi-4-reasoning-plus Phi-4-mini-reasoning
パラメータ数 140億 140億 38億
特徴 基本モデル 強化学習対応 軽量化モデル
推論能力 大規模モデル級 最高精度 効率重視

推論能力について

推論能力とは、複数のステップの分析と内省が必要な複雑なタスクを実行する能力のことを指しており、主に以下のような特徴がある。

  • 数学的問題や科学的課題の段階的な解決
  • 複雑な情報の論理的な分析と処理
  • 多段階の思考プロセスの実行と説明

従来の言語モデルでは大規模なパラメータ数が必要とされていた高度な推論能力を、Phi-4-reasoningシリーズは効率的な学習手法と最適化された設計により小規模モデルでも実現している。特にAIME 2025などの高度な数学的推論を要するタスクでも優れた性能を示している。

小規模言語モデルの推論能力強化に関する考察

小規模言語モデルの推論能力強化は、計算資源の制約がある環境でのAI活用を大きく前進させる可能性を秘めている。特にPhi-4-reasoningシリーズは、従来の大規模モデルに匹敵する推論能力を持ちながら、より少ないリソースで動作することが可能だ。

今後の課題として、モデルの推論速度とメモリ使用量のさらなる最適化が挙げられる。特に複雑な数理計算や長文の論理分析においては、計算効率と精度のバランスを取ることが重要になってくるだろう。

将来的には、エッジデバイスやモバイル機器での高度な推論タスクの実行が一般化することが期待される。これにより、オフライン環境でも高度なAI機能を利用できるようになり、AIの実用範囲が大きく広がる可能性が高い。

参考サイト

  1. ^ マイクロソフト. 「One year of Phi: Small language models making big leaps in AI」. https://azure.microsoft.com/en-us/blog/one-year-of-phi-small-language-models-making-big-leaps-in-ai/, (参照 25-05-05).
  2. 9803
  3. Microsoft. https://www.microsoft.com/ja-jp

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。