FastLabel、ストックマークへ日本語特化型LLM開発用データを提供、GENIAC第2期プロジェクト支援

PR TIMES より
スポンサーリンク
記事の要約
- FastLabelがストックマークへLLM開発用データを提供
- 日本語特化型LLM開発に必要な独自データ作成
- 経済産業省・NEDOのGENIAC第2期プロジェクト支援
スポンサーリンク
FastLabelによるストックマークへのデータ提供
FastLabel株式会社は2025年5月13日、ストックマーク株式会社へ日本語特化型LLM開発に必要な独自データを作成し提供したことを発表した。このデータは、経済産業省・NEDOが推進するGENIAC(国内生成AI開発プロジェクト)第2期における支援の一環として提供されたのだ。
提供されたデータは、数万枚のパワーポイントデータをテキストデータに変換したものだ。図表や画像の意味や意図も自然言語でテキスト化され、ストックマークによるハルシネーションを抑止したドキュメント読解基盤モデルの開発に活用された。
FastLabelはデータ収集・生成からアノテーション、モデル開発、DataOps構築までを支援する企業であり、今回のデータ提供は同社の豊富な経験とノウハウに基づいている。GENIACの審査基準を満たすデータ作成も支援したのだ。
今回のデータ提供は、日本語LLM開発におけるデータ不足という課題への有効な解決策を示唆している。高品質な日本語データの提供は、より精度の高いLLM開発に貢献するだろう。
GENIACプロジェクトとデータ提供の詳細
項目 | 詳細 |
---|---|
提供元 | FastLabel株式会社 |
提供先 | ストックマーク株式会社 |
データ内容 | 数万枚のパワーポイントデータ(テキスト化、図表・画像の意味・意図を含む) |
プロジェクト | 経済産業省・NEDO GENIAC第2期 |
目的 | ハルシネーションを抑止したドキュメント読解基盤モデル開発 |
発表日 | 2025年5月13日 |
スポンサーリンク
LLM開発における課題とFastLabelの支援
日本のLLM開発は、高品質な日本語データの不足と、LLM開発をリードできる人材の不足という課題を抱えている。公開データは英語圏に比べて少なく、日本語特有の表記揺れや曖昧さもモデルの学習を難しくしているのだ。
- 日本語データの不足
- 人材不足
- データ作成・収集へのリソース不足
FastLabelはこれらの課題に対し、高品質なデータ作成とGENIAC要件への対応による支援を提供することで、ストックマークのLLM開発を促進した。これにより、限られた人材のリソースを本質的な研究開発に集中させることが可能になったのだ。
FastLabelによるデータ提供に関する考察
FastLabelによる高品質なデータ提供は、ストックマークのLLM開発を大きく前進させるものとなった。日本語特有の複雑さを考慮したデータ作成は、ハルシネーションの抑制に大きく貢献し、信頼性の高いLLM開発を可能にしたと言えるだろう。しかし、今後、より複雑なドキュメントや専門性の高い分野への対応が必要となる可能性がある。
そのため、FastLabelは、多様なデータ形式への対応や、専門知識を必要とするデータアノテーション技術の更なる高度化を進める必要があるだろう。また、データの品質管理体制の強化や、データ提供プロセス全体の効率化も重要となる。継続的な改善と技術革新によって、更なる高品質なデータ提供を実現していくことが期待される。
さらに、FastLabelは、データ提供だけでなく、モデル開発支援やDataOps構築といった幅広いサービスを提供している。これらのサービスを組み合わせることで、企業はLLM開発における様々な課題を解決し、より効率的にAI開発を進めることが可能になるだろう。今後のFastLabelの更なる活躍に期待したい。
参考サイト
- ^ PR TIMES. 「FastLabel、ストックマーク株式会社へ日本語特化型LLM開発に必要な独自データを作成し提供 | FastLabel株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000177.000065427.html, (参照 25-05-14). 2381
- 経済産業省. https://www.meti.go.jp/index.html
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- 一般財団法人日本次世代企業普及機構が2億件のデータ分析に基づく採用セミナーを開催、早期離職防止策を紹介
- 3PLATZ、Lectoプラットフォーム導入で債権管理と督促業務をデジタル化
- カイタク株式会社がAI電話システム「カイタクAIコール」を先行リリース
- 株式会社シーアイシーがAIセキュリティ分析サービスAiSECUを発表、サイバーセキュリティ対策を強化
- Appierが生成AIツールAdCreative.aiを主力AI製品に統合、マーケティング効率化を実現
- CARTA HOLDINGS、AI推進室設置でAI活用促進とグループシナジー創出を目指す
- CTCがGPIF向けインデックス情報分析クラウド基盤を更改、運用高度化を支援
- CTY・CNS、地域安全協定締結と安心カメラサービス提供開始、地域住民の安全確保に貢献
- 株式会社haco.が学生向けキャリア支援プラットフォーム「Career.base」をリリース、学生の成長を可視化
スポンサーリンク