公開:

NTT Comがrokadocのパブリックベータ版を公開、生成AIとRAGの活用基盤を強化へ

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • NTT Comがrokadocのパブリックベータ版を公開
  • 生成AI・RAG向けのデータ構造化技術を提供
  • ドキュメント構造化機能を無料で試用可能

NTT ComがAI活用を促進するrokadocのパブリックベータ版を公開

NTTコミュニケーションズ株式会社は、企業における生成AI利用時のデータ活用を促進するため、生成AI・RAG向けデータ構造化技術である「rokadoc」のパブリックベータ版を2025年2月19日に公開した。rokadocは図表を含む非構造化データを高精度で構造化データへ変換する技術で、システムや製品のマニュアルをもとに質問に回答するチャットボットや企業内ナレッジ検索時の回答精度向上に活用できる。[1]

rokadocは独自のレイアウト解析技術により、テキストや画像を高精度に区分けし、画像からは説明文を生成することが可能となっている。複雑な表構造にも対応しており、結合セルの有無や罫線の有無などのさまざまなパターンの表形式に対応して構造化されたテキストを出力することができるだろう。

NTT Comは今後、rokadocのパブリックベータ版を通じて顧客課題やフィードバックを集めながら精度を高め、本格提供に向けた準備を進めていく予定だ。また2025年度からは、パートナー企業と連携してデータ加工技術やデータマネジメント基盤、コンサルティングサービスなども組み合わせた統合ソリューションを提供開始する計画となっている。

rokadocの主な機能と特徴

画像処理機能 表構造処理 RAG連携
主な特徴 高精度な画像解析とキャプション生成 複雑な表構造への対応 高精度な検索結果の提供
対応形式 PDF、Word、PowerPoint、Excel 結合セル、罫線なしにも対応 任意の生成AI技術と併用可能
rokadocの詳細はこちら

RAGについて

RAGとは「Retrieval-Augmented Generation」の略称で、大規模言語モデルによるテキスト生成時に外部情報を活用して推論の精度を高める技術のことを指す。主な特徴として以下のような点が挙げられる。

  • 外部情報を活用した高精度な推論が可能
  • 大規模言語モデルの生成精度を向上
  • 企業内の非構造化データを効率的に活用

rokadocはRAGの検索機能と組み合わせることで、類似技術と比較して高い精度での情報検索を実現することが可能となっている。企業が保有する非構造化データの多くはPDFHTML、画像、各種文書など多様な形式で存在しているため、rokadocによる構造化処理との連携は効果的な解決策となるだろう。

参考サイト

  1. ^ NTT. 「企業が保有する膨大なデータの活用を促進する「rokadoc」のパブリックベータ版を公開」. https://www.ntt.com/about-us/press-releases/news/article/2025/0219_2.html, (参照 25-02-21).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。