公開:

Galirage ResearchがExcelファイルのXML化によるRAG精度改善の研究論文を発表、AIの回答精度向上に貢献

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

Galirage ResearchがExcelファイルのXML化によるRAG精度改善の研究論文を発表、AIの回答精度向上に貢献

PR TIMES より


記事の要約

  • Galirage ResearchがRAGの精度改善に関する論文を発表
  • ExcelファイルのXML化によりLLMの回答精度が向上
  • 年間12本の論文公開を目標に研究開発を強化

Galirage ResearchのXML化によるRAG精度改善の研究論文が公開

株式会社GalirageのGalirage Researchは、ExcelファイルのRAG精度改善に関する研究論文をarXivにて2025年2月14日に公開した。VLMやLLMを用いたExcelファイル内のフローチャートに対するRAGの精度低下という課題に対し、OfficeファイルのXML化とデータ前処理によって精度改善を実現することに成功している。[1]

Galirage Researchでは、現場での実践的な課題に根ざした研究を推進することで、業務効率化や新たなAI活用の可能性を探求する方針を打ち出した。研究開発部門の本格始動により、企業としての技術的な優位性を確立するため、2025年は研究開発への大型投資を実施し、年間12本の論文公開を目指すことになっている。

研究の結果、従来手法ではハルシネーションを起こしていた課題において、ExcelファイルをXML形式で読み込み、AIが解読しやすいデータ前処理を実施することで、より正確な回答を生成することに成功した。OfficeファイルのXML化とデータのエンリッチ化により、特定のシナリオにおいてLLMによる回答精度やRAGの検索精度が改善する可能性が示されている。

研究論文の概要まとめ

項目 詳細
論文タイトル Overcoming Vision Language Model Challenges in Diagram Understanding: A Proof-of-Concept with XML-Driven Large Language Models Solutions
研究課題 ExcelファイルのフローチャートにおけるVLM/LLMを用いたRAGの精度低下
提案手法 OfficeファイルのXML化とデータ前処理によるエンリッチ化
実験結果 ハルシネーション課題において正確な回答生成に成功
今後の目標 年間12本の論文公開
論文の詳細はこちら

RAGについて

RAGとは「Retrieval-Augmented Generation」の略称で、大規模言語モデルの回答生成を外部知識で補強する技術のことを指す。主な特徴として、以下のような点が挙げられる。

  • データベースや文書から関連情報を検索して回答を生成
  • 外部知識を活用することで回答の正確性を向上
  • ハルシネーション(誤った情報の生成)を軽減

ExcelファイルのフローチャートなどのダイアグラムデータをRAGで処理する際、Vision-Language ModelやLarge Language Modelでは精度が低下する課題が存在していた。GalirageのXML化アプローチは、データのエンリッチ化によりこの課題を解決し、RAGの検索精度と回答精度を向上させることに成功している。

参考サイト

  1. ^ PR TIMES. 「Galirage Research、ExcelファイルのXML化によるRAGの精度改善に関する論文を発表 | 株式会社Galirageのプレスリリース」. https://prtimes.jp/main/html/rd/p/000000007.000140028.html, (参照 25-02-15).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。