OpenAIが「12 Days of OpenAI」でo1のAPI提供開始、WebRTCサポートやモデルカスタマイズ機能も強化
スポンサーリンク
記事の要約
- OpenAI o1がAPIで利用可能に
- Realtime APIが機能拡張とコスト削減
- Preference Fine-Tuningで開発者向け機能を強化
スポンサーリンク
OpenAIが開発者向け複数の新機能を発表
OpenAIは2024年12月16日、クリスマスに向けたイベント「12 Days of OpenAI」の9日目として「DevDay Holiday Edition」を開催し、開発者向けの複数の新機能を発表した。複雑な多段階タスクを高精度で処理できる推論モデル「o1」のAPI提供を開始し、function callingや構造化出力、開発者メッセージなどの機能を実装している。[1]
Realtime APIには低遅延の自然な会話体験を実現するWebRTCサポートが追加され、音声トークン価格を60%削減することで開発者の負担を軽減した。また、GPT-4o miniを追加することで、より柔軟なモデル選択が可能になり、開発者の要求に応じた最適な環境を提供できるようになった。
さらに新しいモデルカスタマイズ手法「Preference Fine-Tuning」を導入し、Direct Preference Optimizationを用いてモデルの応答を最適化できるようにした。開発言語のサポートも拡充し、新たにGoとJavaのSDKをベータ版として提供を開始している。
OpenAIの新機能まとめ
o1 | Realtime API | Preference Fine-Tuning | |
---|---|---|---|
主な特徴 | 複雑なタスクの高精度処理 | WebRTCサポート | モデル応答の最適化 |
対象ユーザー | Tier 5開発者 | 全開発者 | gpt-4o-2024-08-06利用者 |
価格改定 | - | 60%削減 | 従来のSFTと同価格 |
スポンサーリンク
Direct Preference Optimizationについて
Direct Preference Optimizationとは、モデルの応答を最適化するための手法で、好ましい応答と好ましくない応答のペアを比較学習することで、モデルの出力を調整する技術のことを指す。主な特徴として以下のような点が挙げられる。
- ペアワイズ比較による効率的な学習
- 主観的なタスクに対する高い適応性
- トーンやスタイルの柔軟な調整が可能
OpenAIが導入したPreference Fine-Tuningでは、Direct Preference Optimizationを活用することで、開発者の要望に応じたモデルのカスタマイズを実現している。従来のSupervised Fine-Tuningと比較して、創造的な文章生成やトーンの調整など、主観的な要素が重要なタスクでより効果的な結果を得ることができる。
OpenAI DevDay Holiday Editionに関する考察
OpenAIが開発者向けの新機能を一斉に発表したことは、AIプラットフォームの競争が激化する中で重要な意味を持つ。特にRealtime APIの価格引き下げとGPT-4o miniの導入は、開発者のコスト負担を軽減しつつ、より柔軟なモデル選択を可能にすることで、AIアプリケーション開発の敷居を下げることに成功している。
Direct Preference Optimizationを活用したPreference Fine-Tuningの導入は、モデルのカスタマイズ性を大きく向上させる可能性がある。従来のSupervised Fine-Tuningでは対応が難しかった主観的なタスクへの適用が期待できるが、学習データの品質管理や評価基準の設定など、新たな課題も浮上してくるだろう。
GoとJavaのSDKの提供は、エンタープライズ開発者のニーズに応える重要な一歩となった。今後はさらなる言語サポートの拡充や、企業向けの高度なセキュリティ機能の追加が期待される。
参考サイト
- ^ Open AI. 「OpenAI o1 and new tools for developers」. https://openai.com/index/o1-and-new-tools-for-developers/, (参照 24-12-20).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Discoveryとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- Google WorkspaceがカスタムOIDCプロファイルでのSSO設定機能を追加、クラウドアプリケーションのアクセス管理が柔軟に
- Google Workspaceが管理者向けアカウントリカバリー設定を追加、プライバシー規制対応とセキュリティ強化を実現
- GoogleがAppSheet Admin Consoleを一般提供開始、Workspace管理者のアプリ管理機能が大幅に向上
- グーグルが画像組み合わせ型AIツールWhiskを公開、直感的な操作で独創的な作品生成が可能に
- YouTubeが第三者企業向けAIトレーニング機能を発表、クリエイターによる使用可否の選択が可能に
- GoogleがAI動画生成Veo 2と画像生成Imagen 3を発表、4K動画や多様なアートスタイルの生成が可能に
- GitHubがVisual Studio向けCopilot Freeを公開、AIによる開発効率が25%向上へ
- MicrosoftがWindows 11 Insider Preview Build 26120.2705をリリース、多言語リアルタイム翻訳機能の実装により国際コミュニケーションが向上
- GoogleがProject IDXにGemini統合のInteractive Chatを追加、自然言語による開発効率の向上を実現
- Amazonがふるさと納税サービスを開始、全国約1,000自治体が参画し返礼品の最短翌日配送に対応
スポンサーリンク