AnthropicがClaude Opus 4とSonnet 4を発表、コーディングと推論能力が大幅に向上
スポンサーリンク
記事の要約
- Anthropic社がClaude Opus 4とClaude Sonnet 4を発表
- コーディング、高度な推論、AIエージェント機能を強化
- ツール使用による拡張思考、並列ツール実行、メモリ機能向上を実現
スポンサーリンク
Anthropicが次世代大規模言語モデルClaude 4を発表
Anthropic社は2025年5月23日、次世代大規模言語モデルClaude Opus 4とClaude Sonnet 4を発表した。これらのモデルは、コーディング、高度な推論、AIエージェントの分野で新たな基準を打ち立てているのだ。
Claude Opus 4は、世界最高のコーディングモデルとして位置付けられており、複雑で長期にわたるタスクやエージェントワークフローにおいて持続的なパフォーマンスを発揮する。Claude Sonnet 4は、Claude Sonnet 3.7からの大幅なアップグレードであり、コーディングと推論能力が向上し、指示への対応精度も高まっている。
さらに、Web検索などのツールを使用できる拡張思考機能(ベータ版)、並列ツール実行機能、ローカルファイルへのアクセスによるメモリ機能の大幅な向上が実現している。開発者はローカルファイルにアクセスすることで、重要な情報を保存し、継続性と暗黙知の構築が可能になるのだ。
Claude Codeは一般公開され、GitHub ActionsやVS Code、JetBrainsとのネイティブ統合により、開発者はClaudeとシームレスに連携できるようになった。バックグラウンドタスクもサポートし、編集内容はファイルに直接表示されるため、ペアプログラミングが容易になる。
Anthropic APIには、コード実行ツール、MCPコネクタ、Files API、プロンプトキャッシュ機能(最大1時間)など4つの新機能が追加された。これにより、開発者はより強力なAIエージェントを構築できるようになっている。
Claude Opus 4とSonnet 4はハイブリッドモデルで、ほぼ瞬時の応答と、より深い推論のための拡張思考の2つのモードを提供する。Pro、Max、Team、Enterpriseプランでは両モデルと拡張思考が利用可能で、Sonnet 4は無料ユーザーも利用できる。両モデルはAnthropic API、Amazon Bedrock、Google CloudのVertex AIで利用可能だ。
Claude 4モデルの機能比較
モデル | SWE-bench | Terminal-bench | 価格(百万トークン) | 備考 |
---|---|---|---|---|
Claude Opus 4 | 72.5% | 43.2% | $15/$75 (入力/出力) | 世界最高のコーディングモデル |
Claude Sonnet 4 | 72.7% | - | $3/$15 (入力/出力) | Sonnet 3.7からの大幅な改善 |
スポンサーリンク
拡張思考とメモリ機能について
Claude 4モデルは、ツール使用による拡張思考機能を備えている。これは、推論とツール使用を交互に行うことで、応答の質を向上させる機能だ。モデルは、Web検索などのツールを並列で使用することも可能である。
- ツール使用による推論の深化
- 並列ツール実行による効率化
- ローカルファイルアクセスによるメモリ機能向上
さらに、ローカルファイルへのアクセスが許可されると、Opus 4は重要な情報を保存する「メモリファイル」を作成・維持する能力を持つ。これにより、長期的なタスク認識、一貫性、エージェントタスクのパフォーマンスが向上するのだ。
Claude 4に関する考察
Claude 4モデルは、コーディング能力や推論能力において、従来のモデルを大きく凌駕している点が評価できる。特に、複雑なタスクや長期的な作業においても高いパフォーマンスを維持できる点は、AIエージェントの開発において大きな進歩と言えるだろう。しかし、ツールへの依存度が高まることで、ツールの利用可能性や信頼性に依存するリスクも存在する可能性がある。
今後、より高度な推論能力や、より多様なツールとの連携が期待される。また、セキュリティ面での強化や、誤った情報生成に対する対策も重要となるだろう。これらの課題をクリアすることで、Claude 4は様々な分野でより幅広く活用される可能性を秘めている。
さらに、ユーザーインターフェースの改善や、より直感的な操作方法の提供も重要となるだろう。より多くの開発者やユーザーが容易に利用できるようになることで、AI技術の普及が加速し、社会全体への貢献も大きくなるはずだ。
参考サイト
- ^ Anthropic. 「Introducing Claude 4 Anthropic」. https://www.anthropic.com/news/claude-4, (参照 25-05-24). 2671
- Google. https://blog.google/intl/ja-jp/
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- mign社がAI建築ビジュアライゼーションツール「morphix」をリリース、建築業界のDX推進に貢献
- 武州製薬、SAP S/4HANA導入でグローバル市場対応強化
- 弥生株式会社がLeafeaに出資、中小企業向け福利厚生サービス強化へ
- 北國銀行と石川県信用保証協会が事業者支援に向けたデータ連携を開始、API連携で迅速な金融支援を実現
- 防災科研、富士通、SDS、三菱電機が日本版災害チャータ高度化に向けた共同研究契約を締結
- 防災科研、富士通、SDS、三菱電機が日本版災害チャータ高度化に向けた共同研究契約を締結、衛星データ活用による災害対応の迅速化を目指す
- 株式会社武蔵野、AIシステムMRAGによる新卒説明会で質疑応答を効率化
- 博報堂とDAZNが戦略的提携、AI活用でスポーツ視聴者の感情を起点としたビジネス開発
- 日立とたけびし、HIPFとデバイスゲートウェイ連携で製品トレーサビリティソリューション提供開始
- 日立ソリューションズ・クリエイト、石川県信用保証協会のBCP対策をクラウドサービスで支援、災害時でも業務継続を実現
スポンサーリンク