公開:

ソフトクリエイトがSafe AI Gateway ver.3.4で画像認識機能を搭載し生成AIの活用範囲が拡大

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • Safe AI Gateway ver.3.4で画像認識機能を搭載
  • 画像から物体やシーンを特定しテキストを生成
  • 全プランで標準機能として提供開始

Safe AI Gateway ver.3.4への画像認識機能の搭載で業務効率化を促進

株式会社ソフトクリエイトは企業・団体向け生成AIサービスSafe AI Gatewayに新たに画像からテキストを生成させる機能を2024年12月6日より提供開始した。Safe AI Gateway ver.3.4から標準機能として搭載された画像認識機能により、アップロードされた画像ファイルから物体やシーンを自動的に特定し質問に対する回答を生成することが可能になっている。[1]

Safe AI Gatewayの画像認識機能は複数のファイル形式に対応しており、PNGJPEGなどの画像ファイルから情報を抽出することが可能だ。画像認識機能を活用することで物体の名称や状態の確認、デザインへのフィードバック、グラフの傾向分析など多岐にわたる業務でAIによる支援を受けられるようになっている。

本機能はSafe AI Gatewayの全プランで追加料金なしで利用可能となっており、企業のDX推進を後押しする要素として期待が高まっている。利用に際しては画像の認識処理に応じて一定のトークンが消費されるが、日本語1文字あたり約1トークンという換算で分かりやすい課金体系を採用している。

Safe AI Gateway ver.3.4の新機能まとめ

画像認識機能 画像分析 テキスト生成
主な特徴 物体・シーンの特定 グラフ・表の読取 質問への回答生成
対応形式 PNG、JPEG 複数画像対応 日本語文章
利用条件 全プラン対応 トークン消費 標準機能

マルチモーダルAIについて

マルチモーダルAIとは、テキストや画像、音声などの異なる種類のデータを同時に理解し処理する能力を持つ人工知能技術のことを表している。以下のような特徴的な機能を持つ技術として注目を集めている。

  • 複数の種類のデータを統合的に処理し解析
  • 異なるデータ形式間での相互変換が可能
  • より自然な人工知能の実現に貢献

Safe AI Gateway ver.3.4に搭載されたマルチモーダルAI機能は、画像データからテキストを生成する処理を実現している。企業のデータ活用において画像とテキストの相互連携を強化することで、業務効率の向上とDXの推進に寄与することが期待されている。

参考サイト

  1. ^ 株式会社ソフトクリエイト. 「企業・団体向け生成AI「Safe AI Gateway」が画像認識の機能をリリース」. https://www.softcreate.co.jp/news/detail/309, (参照 24-12-09).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。