公開:

dotDataがFeature Factory 1.3で特徴量自動設計を強化、LLM対応とテキストデータ分析機能を搭載

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

dotDataがFeature Factory 1.3で特徴量自動設計を強化、LLM対応とテキストデータ分析機能を搭載

PR TIMES より


記事の要約

  • dotDataがFeature Factory 1.3をリリース
  • AIによる特徴量設計の強化とLLM対応を拡充
  • 段階的な特徴量拡充機能とテキストデータ対応を実現

dotDataのFeature Factory 1.3が実現する特徴量自動設計の進化

dotData, Inc.は特徴量自動設計技術のリーダー企業として、AIによる特徴量設計を強化したdotData Feature Factory 1.3を2025年2月17日にリリースした。特徴量の段階的拡充機能により、既存の特徴量を補完しながら予測の残差にフィットする新たな特徴量を発見できるようになり、予測精度の向上と既存アセットの最大活用を実現している。[1]

dotData Feature Factory 1.3はLLMによる組み合わせ特徴量の発見機能を実装することで、統計的な有意性とドメインの文脈を考慮した特徴量抽出を可能にした。従来の統計ベースの手法では解釈が困難だった疑似相関の問題を解決し、より実用的な特徴量の自動設計を実現することで、データサイエンティストの生産性を大幅に向上させている。

さらにNLP技術を活用したテキストデータの特徴量自動設計機能により、売上レポートや顧客レビューなどの非構造化テキストから有用な特徴量を抽出することが可能になった。数値やカテゴリデータとの組み合わせにより、これまで見過ごされていた重要なインサイトの発見を支援し、企業のデータ活用基盤を強化している。

dotData Feature Factory 1.3の新機能まとめ

特徴量の段階的拡充 LLMによる特徴量発見 テキストデータ対応
主な機能 既存特徴量の補完と予測残差対応 複数カラムの組み合わせ発見 非構造化テキストからの特徴量抽出
技術基盤 特徴量自動設計技術 Amazon Bedrock、vLLM NLP技術
対応環境 Python 3.11 Databricks Runtime 14.3/15.4 Amazon EMR 7.5.0
dotData Feature Factoryの詳細はこちら

特徴量自動設計について

特徴量自動設計とは、機械学習モデルの性能向上に不可欠な特徴量を自動的に設計・抽出する技術のことを指す。主な特徴として以下のような点が挙げられる。

  • 複雑なデータ間の関係性を自動的に発見し特徴量化
  • データサイエンティストの作業効率を大幅に向上
  • 人間のバイアスに影響されない客観的な特徴抽出が可能

特徴量自動設計技術はAIプラットフォームの基盤として重要な役割を果たしており、機械学習モデルの予測精度向上に大きく貢献する。dotDataのFeature Factory 1.3では、この技術をさらに進化させLLMと組み合わせることで、より高度な特徴量の自動設計を実現している。

参考サイト

  1. ^ PR TIMES. 「dotData、AIによる特徴量設計を強化し、LLM対応を拡充したdotData Feature Factory 1.3を発表 | dotData, Inc.のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000045.000053039.html, (参照 25-02-18).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。