dotDataがFeature Factory 1.3で特徴量自動設計を強化、LLM対応とテキストデータ分析機能を搭載

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

IT・テックのコネクトメディア「ゼゼック」
カテゴリ毎のアーカイブ記事一覧
【カテゴリ別】2025年02月のアーカイブ一覧
【2025年02月】AIに関するアーカイブ一覧
【2025年02月14日】AIに関するアーカイブ一覧
dotDataがFeature Factory 1.3で特徴量自動設計を強化、LLM対応とテキストデータ分析機能を搭載

dotDataがFeature Factory 1.3で特徴量自動設計を強化、LLM対応とテキストデータ分析機能を搭載

PR TIMES より

記事の要約

dotDataがFeature Factory 1.3をリリース
AIによる特徴量設計の強化とLLM対応を拡充
段階的な特徴量拡充機能とテキストデータ対応を実現

dotDataのFeature Factory 1.3が実現する特徴量自動設計の進化

dotData, Inc.は特徴量自動設計技術のリーダー企業として、AIによる特徴量設計を強化したdotData Feature Factory 1.3を2025年2月17日にリリースした。特徴量の段階的拡充機能により、既存の特徴量を補完しながら予測の残差にフィットする新たな特徴量を発見できるようになり、予測精度の向上と既存アセットの最大活用を実現している。^[1]

dotData Feature Factory 1.3はLLMによる組み合わせ特徴量の発見機能を実装することで、統計的な有意性とドメインの文脈を考慮した特徴量抽出を可能にした。従来の統計ベースの手法では解釈が困難だった疑似相関の問題を解決し、より実用的な特徴量の自動設計を実現することで、データサイエンティストの生産性を大幅に向上させている。

さらにNLP技術を活用したテキストデータの特徴量自動設計機能により、売上レポートや顧客レビューなどの非構造化テキストから有用な特徴量を抽出することが可能になった。数値やカテゴリデータとの組み合わせにより、これまで見過ごされていた重要なインサイトの発見を支援し、企業のデータ活用基盤を強化している。

dotData Feature Factory 1.3の新機能まとめ

	特徴量の段階的拡充	LLMによる特徴量発見	テキストデータ対応
主な機能	既存特徴量の補完と予測残差対応	複数カラムの組み合わせ発見	非構造化テキストからの特徴量抽出
技術基盤	特徴量自動設計技術	Amazon Bedrock、vLLM	NLP技術
対応環境	Python 3.11	Databricks Runtime 14.3/15.4	Amazon EMR 7.5.0

dotData Feature Factoryの詳細はこちら

特徴量自動設計について

特徴量自動設計とは、機械学習モデルの性能向上に不可欠な特徴量を自動的に設計・抽出する技術のことを指す。主な特徴として以下のような点が挙げられる。

複雑なデータ間の関係性を自動的に発見し特徴量化
データサイエンティストの作業効率を大幅に向上
人間のバイアスに影響されない客観的な特徴抽出が可能

特徴量自動設計技術はAIプラットフォームの基盤として重要な役割を果たしており、機械学習モデルの予測精度向上に大きく貢献する。dotDataのFeature Factory 1.3では、この技術をさらに進化させLLMと組み合わせることで、より高度な特徴量の自動設計を実現している。

参考サイト

^ PR TIMES. 「dotData、AIによる特徴量設計を強化し、LLM対応を拡充したdotData Feature Factory 1.3を発表 | dotData, Inc.のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000045.000053039.html, (参照 25-02-18).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム