公開:

CohereがマルチモーダルEmbed 3をAzure AI Model Catalogで公開、エンタープライズ検索の革新へ

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • CohereのEmbed 3がマルチモーダル対応で公開
  • 画像とテキストの両方に対応した検索が可能に
  • Azure AI Model Catalogで利用可能に

Cohereのマルチモーダル対応Embed 3によるエンタープライズ検索の進化

Cohereは2024年10月23日に、画像とテキストの両方に対応したエンブベッディングモデルEmbed 3をAzure AI Model Catalogで公開した。企業が保有する大量のデータを形式を問わず検索・分析できるようになり、エンタープライズ検索の可能性が大きく広がることになった。[1]

Embed 3は入力されたテキストや画像を数値の文字列に変換し、高次元のベクトル空間で類似性を比較することで検索を実現している。テキストと画像のエンベッディングを同一の空間に統合することで、シームレスな検索体験を提供することが可能になった。

また、Embed 3はBEIRやFlickr/CoCoなどの主要なベンチマークで最高水準の精度を達成しており、100以上の言語に対応している。データベースのストレージコストを最小限に抑えるためのエンベッディング圧縮機能も搭載され、大規模な運用にも対応可能だ。

Embed 3の主要機能まとめ

項目 詳細
対応モダリティ テキストおよび画像データ
主要ベンチマーク BEIRおよびFlickr/CoCo
言語対応 100言語以上
最適化機能 エンベッディング圧縮によるストレージ効率化
利用環境 Azure AI Model Catalog
Azure無料トライアルの詳細はこちら

エンベッディングモデルについて

エンベッディングモデルとは、テキストや画像などの入力データを数値のベクトルに変換する機械学習モデルのことを指す。主な特徴として以下のような点が挙げられる。

  • データの意味や特徴を数値で表現可能
  • 異なる種類のデータを同一空間で比較可能
  • 検索や推薦システムの基盤技術として活用

エンベッディングモデルは高次元のベクトル空間でデータの類似性を計算することで、より直感的な検索や分析を可能にしている。Embed 3では画像とテキストの両方に対応したエンベッディングを生成し、統一された検索空間を提供することで、より柔軟なエンタープライズ検索を実現している。

マルチモーダル対応Embed 3に関する考察

Embed 3のマルチモーダル対応は、企業が保有する多様なデータ資産の活用において画期的な進展となる可能性が高い。従来は別々に管理されていたテキストと画像データを統合的に検索できるようになることで、業務効率の大幅な向上が期待できるだろう。

一方で、大規模なデータセットに対するエンベッディングの生成や保存には、相応のコンピューティングリソースとストレージ容量が必要となる課題がある。Embed 3が提供するエンベッディング圧縮機能は有効な対策となるが、長期的には更なる最適化技術の開発が望まれるだろう。

今後は、動画や音声などより多様なモダリティへの対応や、リアルタイムでのエンベッディング更新機能の追加が期待される。企業のデジタルトランスフォーメーションが加速する中、Embed 3の進化は企業のデータ活用をより一層促進するだろう。

参考サイト

  1. ^ Microsoft Teams Blog. 「Cohere Multimodal Embed 3 available on Azure」. https://techcommunity.microsoft.com/t5/ai-machine-learning-blog/introducing-multimodal-embed-3-powering-enterprise-search-across/ba-p/4276660, (参照 24-10-25).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。