公開:

FastLabel、ストックマークへ日本語特化型LLM開発用データを提供、GENIAC第2期プロジェクト支援

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

FastLabel、ストックマークへ日本語特化型LLM開発用データを提供、GENIAC第2期プロジェクト支援

PR TIMES より


記事の要約

  • FastLabelがストックマークへLLM開発用データを提供
  • 日本語特化型LLM開発に必要な独自データ作成
  • 経済産業省・NEDOのGENIAC第2期プロジェクト支援

FastLabelによるストックマークへのデータ提供

FastLabel株式会社は2025年5月13日、ストックマーク株式会社へ日本語特化型LLM開発に必要な独自データを作成し提供したことを発表した。このデータは、経済産業省・NEDOが推進するGENIAC(国内生成AI開発プロジェクト)第2期における支援の一環として提供されたのだ。

提供されたデータは、数万枚のパワーポイントデータをテキストデータに変換したものだ。図表や画像の意味や意図も自然言語でテキスト化され、ストックマークによるハルシネーションを抑止したドキュメント読解基盤モデルの開発に活用された。

FastLabelはデータ収集・生成からアノテーション、モデル開発、DataOps構築までを支援する企業であり、今回のデータ提供は同社の豊富な経験とノウハウに基づいている。GENIACの審査基準を満たすデータ作成も支援したのだ。

今回のデータ提供は、日本語LLM開発におけるデータ不足という課題への有効な解決策を示唆している。高品質な日本語データの提供は、より精度の高いLLM開発に貢献するだろう。

GENIACプロジェクトとデータ提供の詳細

項目 詳細
提供元 FastLabel株式会社
提供先 ストックマーク株式会社
データ内容 数万枚のパワーポイントデータ(テキスト化、図表・画像の意味・意図を含む)
プロジェクト 経済産業省・NEDO GENIAC第2期
目的 ハルシネーションを抑止したドキュメント読解基盤モデル開発
発表日 2025年5月13日
ストックマーク発表資料

LLM開発における課題とFastLabelの支援

日本のLLM開発は、高品質な日本語データの不足と、LLM開発をリードできる人材の不足という課題を抱えている。公開データは英語圏に比べて少なく、日本語特有の表記揺れや曖昧さもモデルの学習を難しくしているのだ。

  • 日本語データの不足
  • 人材不足
  • データ作成・収集へのリソース不足

FastLabelはこれらの課題に対し、高品質なデータ作成とGENIAC要件への対応による支援を提供することで、ストックマークのLLM開発を促進した。これにより、限られた人材のリソースを本質的な研究開発に集中させることが可能になったのだ。

FastLabelによるデータ提供に関する考察

FastLabelによる高品質なデータ提供は、ストックマークのLLM開発を大きく前進させるものとなった。日本語特有の複雑さを考慮したデータ作成は、ハルシネーションの抑制に大きく貢献し、信頼性の高いLLM開発を可能にしたと言えるだろう。しかし、今後、より複雑なドキュメントや専門性の高い分野への対応が必要となる可能性がある。

そのため、FastLabelは、多様なデータ形式への対応や、専門知識を必要とするデータアノテーション技術の更なる高度化を進める必要があるだろう。また、データの品質管理体制の強化や、データ提供プロセス全体の効率化も重要となる。継続的な改善と技術革新によって、更なる高品質なデータ提供を実現していくことが期待される。

さらに、FastLabelは、データ提供だけでなく、モデル開発支援やDataOps構築といった幅広いサービスを提供している。これらのサービスを組み合わせることで、企業はLLM開発における様々な課題を解決し、より効率的にAI開発を進めることが可能になるだろう。今後のFastLabelの更なる活躍に期待したい。

参考サイト

  1. ^ PR TIMES. 「FastLabel、ストックマーク株式会社へ日本語特化型LLM開発に必要な独自データを作成し提供 | FastLabel株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000177.000065427.html, (参照 25-05-14).
  2. 2381
  3. 経済産業省. https://www.meti.go.jp/index.html

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。