dotDataがFeature Factory 1.3で特徴量自動設計を強化、LLM対応とテキストデータ分析機能を搭載

PR TIMES より
記事の要約
- dotDataがFeature Factory 1.3をリリース
- AIによる特徴量設計の強化とLLM対応を拡充
- 段階的な特徴量拡充機能とテキストデータ対応を実現
dotDataのFeature Factory 1.3が実現する特徴量自動設計の進化
dotData, Inc.は特徴量自動設計技術のリーダー企業として、AIによる特徴量設計を強化したdotData Feature Factory 1.3を2025年2月17日にリリースした。特徴量の段階的拡充機能により、既存の特徴量を補完しながら予測の残差にフィットする新たな特徴量を発見できるようになり、予測精度の向上と既存アセットの最大活用を実現している。[1]
dotData Feature Factory 1.3はLLMによる組み合わせ特徴量の発見機能を実装することで、統計的な有意性とドメインの文脈を考慮した特徴量抽出を可能にした。従来の統計ベースの手法では解釈が困難だった疑似相関の問題を解決し、より実用的な特徴量の自動設計を実現することで、データサイエンティストの生産性を大幅に向上させている。
さらにNLP技術を活用したテキストデータの特徴量自動設計機能により、売上レポートや顧客レビューなどの非構造化テキストから有用な特徴量を抽出することが可能になった。数値やカテゴリデータとの組み合わせにより、これまで見過ごされていた重要なインサイトの発見を支援し、企業のデータ活用基盤を強化している。
dotData Feature Factory 1.3の新機能まとめ
特徴量の段階的拡充 | LLMによる特徴量発見 | テキストデータ対応 | |
---|---|---|---|
主な機能 | 既存特徴量の補完と予測残差対応 | 複数カラムの組み合わせ発見 | 非構造化テキストからの特徴量抽出 |
技術基盤 | 特徴量自動設計技術 | Amazon Bedrock、vLLM | NLP技術 |
対応環境 | Python 3.11 | Databricks Runtime 14.3/15.4 | Amazon EMR 7.5.0 |
特徴量自動設計について
特徴量自動設計とは、機械学習モデルの性能向上に不可欠な特徴量を自動的に設計・抽出する技術のことを指す。主な特徴として以下のような点が挙げられる。
- 複雑なデータ間の関係性を自動的に発見し特徴量化
- データサイエンティストの作業効率を大幅に向上
- 人間のバイアスに影響されない客観的な特徴抽出が可能
特徴量自動設計技術はAIプラットフォームの基盤として重要な役割を果たしており、機械学習モデルの予測精度向上に大きく貢献する。dotDataのFeature Factory 1.3では、この技術をさらに進化させLLMと組み合わせることで、より高度な特徴量の自動設計を実現している。
参考サイト
- ^ PR TIMES. 「dotData、AIによる特徴量設計を強化し、LLM対応を拡充したdotData Feature Factory 1.3を発表 | dotData, Inc.のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000045.000053039.html, (参照 25-02-18).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- VGG(Visual Geometry Group)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- Watsonとは?意味をわかりやすく簡単に解説
- Watson Assistantとは?意味をわかりやすく簡単に解説
- 【CVE-2025-21407】Windows Telephony Serviceに深刻な脆弱性、広範なバージョンのWindowsに影響
- NTTネクシアが金融業界向けオンラインセミナーを開催、AI活用とマネーローンダリング対策のトレンドを解説
- 5社が湘南アイパークでGPU計算力リモート提供実証実験を開始、IOWN APNによる安全なAI創薬基盤の構築へ
- プラスオートメーションが越境ECプラットフォームにAirRobを導入、高密度保管と自動化で物流効率が向上
- Polimill社がQommonsAIの導入サポート研修を宮崎県新富町で実施、自治体職員の実務能力向上に貢献
- JETROがWeb3 Salon - VC Connectを初開催、国内外の投資家とスタートアップのマッチングを促進
- Grand Centralがタクシーサイネージで動画広告を開始、セールスコンサルティングの認知度向上を図る
- パーフェクト社が大阪万博ヘルスケアパビリオンへAI肌解析技術を提供、25年後の自分と未来体験が可能に
- avatarin株式会社が北九州空港でアバターロボットnewmeによる案内業務の実証実験を開始、将来的な人手不足解消に向けた取り組みを推進
- estieと日鉄興和不動産がオフィスリーシング業務でDX協業、物件データと顧客情報の連携で業務効率化へ