OpenAIが初のAIエージェントOperatorを発表、Webブラウザー操作の自動化機能でユーザー体験が向上へ

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

IT・テックのコネクトメディア「ゼゼック」
カテゴリ毎のアーカイブ記事一覧
【カテゴリ別】2025年01月のアーカイブ一覧
【2025年01月】AIに関するアーカイブ一覧
【2025年01月22日】AIに関するアーカイブ一覧
OpenAIが初のAIエージェントOperatorを発表、Webブラウザー操作の自動化機能でユーザー体験が向上へ

記事の要約
OpenAIの新AIエージェント「Operator」が持つ革新的な機能
Operatorの主な機能と特徴まとめ
Computer-Using Agent（CUA）について
OpenAIのOperatorに関する考察
参考サイト

記事の要約

OpenAIが初のAIエージェント「Operator」を発表
ChatGPT Proユーザー向けに研究プレビュー版を公開
Plus/Team/Enterpriseへの拡大とChatGPT統合を予定

OpenAIの新AIエージェント「Operator」が持つ革新的な機能

OpenAIは2025年1月23日、同社初のAIエージェント「Operator」を発表し、米国のChatGPT Proユーザー向けに研究プレビュー版の提供を開始した。Operatorは独自のブラウザを通じてWebページを閲覧・操作できる機能を備えており、ユーザーに代わってタスクを自律的に実行することが可能になっている。^[1]

Operatorの中核を担うのは新モデル「Computer-Using Agent（CUA）」で、GPT-4oの視覚機能と強化学習による高度な推論を組み合わせることでGUIの操作を実現している。Webブラウザーをスクリーンショットで認識し、マウスとキーボードでの操作を再現することで、カスタムAPIを必要とせずにWeb上でのアクションが可能だ。

OpenAIは今後、ユーザーからのフィードバックを基に機能改善を進めながら、Plus/Team/Enterpriseユーザーへの提供拡大とChatGPTへの統合を計画している。また、近くCUAモデルをAPI経由で公開し、開発者が独自のコンピューター操作エージェントを構築できるようにする予定だ。

Operatorの主な機能と特徴まとめ

	基本機能	安全対策	将来計画
主な特徴	Webブラウザー操作の自動化	3層の安全対策実装	APIの公開予定
対象範囲	フォーム入力、オンライン注文など	ログイン、支払い処理の保護	Plus/Team/Enterprise展開
技術基盤	CUAモデル搭載	モニタリングシステム導入	ChatGPTとの統合

Computer-Using Agent（CUA）について

Computer-Using Agent（CUA）とは、グラフィカルユーザーインターフェイス（GUI）の操作に特化した新しいAIモデルのことを指す。主な特徴として、以下のような点が挙げられる。

GPT-4oの視覚機能と強化学習を組み合わせた設計
スクリーンショットによるインターフェース認識機能
マウスとキーボード操作の完全再現が可能

CUAモデルはOperatorの中核技術として、WebArenaとWebVoyagerという2つの主要なブラウザー使用ベンチマークで最先端の成果を達成している。Operatorの研究プレビュー版では、このCUAモデルを活用してWebブラウザーの操作を自動化し、ユーザーの作業効率を大幅に向上させることが可能だ。