NTT Comがrokadocのパブリックベータ版を公開、生成AIとRAGの活用基盤を強化へ
記事の要約
- NTT Comがrokadocのパブリックベータ版を公開
- 生成AI・RAG向けのデータ構造化技術を提供
- ドキュメント構造化機能を無料で試用可能
NTT ComがAI活用を促進するrokadocのパブリックベータ版を公開
NTTコミュニケーションズ株式会社は、企業における生成AI利用時のデータ活用を促進するため、生成AI・RAG向けデータ構造化技術である「rokadoc」のパブリックベータ版を2025年2月19日に公開した。rokadocは図表を含む非構造化データを高精度で構造化データへ変換する技術で、システムや製品のマニュアルをもとに質問に回答するチャットボットや企業内ナレッジ検索時の回答精度向上に活用できる。[1]
rokadocは独自のレイアウト解析技術により、テキストや画像を高精度に区分けし、画像からは説明文を生成することが可能となっている。複雑な表構造にも対応しており、結合セルの有無や罫線の有無などのさまざまなパターンの表形式に対応して構造化されたテキストを出力することができるだろう。
NTT Comは今後、rokadocのパブリックベータ版を通じて顧客課題やフィードバックを集めながら精度を高め、本格提供に向けた準備を進めていく予定だ。また2025年度からは、パートナー企業と連携してデータ加工技術やデータマネジメント基盤、コンサルティングサービスなども組み合わせた統合ソリューションを提供開始する計画となっている。
rokadocの主な機能と特徴
画像処理機能 | 表構造処理 | RAG連携 | |
---|---|---|---|
主な特徴 | 高精度な画像解析とキャプション生成 | 複雑な表構造への対応 | 高精度な検索結果の提供 |
対応形式 | PDF、Word、PowerPoint、Excel | 結合セル、罫線なしにも対応 | 任意の生成AI技術と併用可能 |
RAGについて
RAGとは「Retrieval-Augmented Generation」の略称で、大規模言語モデルによるテキスト生成時に外部情報を活用して推論の精度を高める技術のことを指す。主な特徴として以下のような点が挙げられる。
- 外部情報を活用した高精度な推論が可能
- 大規模言語モデルの生成精度を向上
- 企業内の非構造化データを効率的に活用
rokadocはRAGの検索機能と組み合わせることで、類似技術と比較して高い精度での情報検索を実現することが可能となっている。企業が保有する非構造化データの多くはPDFやHTML、画像、各種文書など多様な形式で存在しているため、rokadocによる構造化処理との連携は効果的な解決策となるだろう。
参考サイト
- ^ NTT. 「企業が保有する膨大なデータの活用を促進する「rokadoc」のパブリックベータ版を公開」. https://www.ntt.com/about-us/press-releases/news/article/2025/0219_2.html, (参照 25-02-21).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- VGG(Visual Geometry Group)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- Watsonとは?意味をわかりやすく簡単に解説
- Watson Assistantとは?意味をわかりやすく簡単に解説
- GoogleがMeetの自動ノート作成機能を拡張、会議の次のステップを自動抽出し生産性向上へ
- GoogleがMeetのキャプション機能を刷新、過去30分間の会話履歴スクロールが可能に
- GoogleがWorkspace向けGmail DLPを一般提供開始、企業の機密情報保護とコンプライアンス対策を強化
- GoogleがWorkspaceアプリのGemini機能を17言語に拡大、グローバルな業務効率化を推進
- PerplexityがDeepSeek-R1ベースの大規模言語モデルR1 1776を公開、検閲の制限なく正確な情報提供が可能に
- モバイル社会研究所が小中学生の生成AI利用調査を公表、中学生の利用率が親を上回り教育現場での活用に注目
- MicrosoftがAzure SDK for Rust Betaを公開、高性能で安全なクラウドアプリケーション開発が可能に
- MicrosoftがAdaptive Cardsドキュメントハブを公開、開発者の生産性向上とUI構築の効率化を実現
- ChromaがC# SDKを公開、AIアプリケーション開発の効率化と機能拡張に期待
- Visual Studio 2022 17.13でコード分析機能が強化、セキュリティ警告の精度向上で開発効率が改善