公開:

ロビンソン・コンサルティングが画面操作AI「DeepAgent」を発表、業務自動化の新時代へ

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

ロビンソン・コンサルティングが画面操作AI「DeepAgent」を発表、業務自動化の新時代へ

PR TIMES より


記事の要約

  • ロビンソン・コンサルティングが画面操作AI「DeepAgent」を発表
  • SIer・RPAベンダー向けに限定提供を開始
  • VLMを活用した業務手順の自動学習・実行が可能

画面操作AI「DeepAgent」がSIer向けに提供開始

ロビンソン・コンサルティングは画面操作を自律的に学習・実行するAIエージェント「DeepAgent」の提供を2025年4月より開始した。独自開発したVLM(Vision-Language Model)を活用し、画面のキャプチャ画像と人の操作履歴から業務手順を学習・実行することが可能となっている。[1]

従来のRPAでは対応が困難であった例外対応や頻繁に変わるUIにも柔軟に対応できる特徴を持ち、経理部門での請求書処理や営業事務での受注管理など、幅広い業務での活用が期待されている。第一弾としてSIerおよびRPAベンダー向けに限定提供を実施し、実践的な導入支援を進めていく方針だ。

今後の展開として、VLMの認識能力・処理速度の向上やセキュリティ機能の強化、業種特化モデルの開発などを予定している。操作ログ記録やアクセス制御、情報マスキングなどの管理機能を順次搭載し、将来的には一般企業や個人ユーザーへの提供も視野に入れている。

DeepAgentの主な機能まとめ

項目 詳細
提供開始時期 2025年4月
主な機能 画面操作の自律学習・実行、例外対応、UI変更への対応
対象ユーザー SIer、RPAベンダー(第一弾)
活用例 請求書処理、受注管理、進捗報告の集計
今後の展開 処理速度向上、セキュリティ強化、業種特化モデル開発
DeepAgentの詳細はこちら

VLM(Vision-Language Model)について

VLMとは、画像認識と自然言語処理を組み合わせた人工知能モデルのことを指しており、主な特徴として以下のような点が挙げられる。

  • 画像内の視覚情報を理解し自然言語で処理可能
  • 画像とテキストを統合的に分析し意味を解釈
  • ユーザーインターフェースの認識と操作を自動化

VLMはDeepAgentの中核技術として活用されており、画面上の視覚要素を認識し操作手順を学習することで、人間の作業を正確に再現することが可能となっている。この技術により、従来のRPAでは困難だった複雑なインターフェースへの対応や、画面レイアウトが変更された場合の柔軟な適応が実現されているのだ。

参考サイト

  1. ^ PR TIMES. 「“操作するAI”で、現場の負担をゼロへ。画面操作AI「DeepAgent」提供開始 | 株式会社ロビンソン・コンサルティングのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000026.000125282.html, (参照 25-04-24).
  2. 1704

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。