東芝が産業用画像解析AIを開発、少数データで高精度な事前学習を実現し産業分野の自動化に貢献
スポンサーリンク
記事の要約
- 東芝が少数データで高精度な画像解析AIを開発
- 特殊画像でも自動生成で事前学習が可能に
- 産業分野での効率化・省人化に貢献
スポンサーリンク
東芝が開発した高精度な画像解析AIの詳細
株式会社東芝は2024年12月17日、事前学習に必要な学習データが十分に得られない産業用途の画像でも、少数の実画像データから学習データを自動生成し迅速かつ高精度に解析できる画像解析AIを開発した。独自の事前学習方式により、顕微鏡画像や赤外線画像、生体画像といった特殊画像でも高精度な解析が可能になり、従来画像解析AIの活用が難しかった産業分野での適用が実現したのだ。[1]
東芝は赤外線画像、顕微鏡画像、ウェハ画像、病理画像、眼底画像の5種類の非自然画像データセットからランダムに40~1,000枚の実画像データを選択し、画像識別タスク評価を実施した。少数の実画像データから9,000~30,000枚の事前学習用画像を自動生成することで、130万枚の実画像データを持つImageNetを上回る精度を実現している。
半導体製品の品質検査や医療現場での診断支援など、専用の装置で撮影された産業用途の画像は、撮影に時間やコストを要し、倫理やプライバシーの観点から二次利用が制限される場合もあった。新開発の画像解析AIは最小40枚という少数の実画像データから迅速に高精度な解析を実現し、産業現場での自動化と効率化に大きく貢献する可能性を秘めている。
画像解析AIの性能評価まとめ
非自然画像データ | 事前学習データ | 精度評価 | |
---|---|---|---|
データ種類 | 赤外線画像、顕微鏡画像、ウェハ画像、病理画像、眼底画像 | 40~1,000枚から9,000~30,000枚を生成 | ImageNetを上回る識別精度 |
従来手法との比較 | 特殊環境下での撮影画像 | ImageNet(130万枚) | 従来手法より高精度 |
スポンサーリンク
事前学習について
事前学習とは、AIモデルに対して特定のタスクを学習させる前に、大規模なデータセットを用いて基礎的な特徴抽出能力を獲得させる学習手法のことである。以下のような特徴を持っている。
- 少量のデータでも高精度な学習が可能
- 対象画像と類似の特徴を持つデータセットが効果的
- 転移学習の基礎となる重要な技術
従来の事前学習では自然画像を用いることが一般的だったが、産業用途の非自然画像は特徴が大きく異なるため十分な精度が得られなかった。東芝の新技術は対象画像から直接学習データを自動生成することで、非自然画像に特化した事前学習を可能にし、高精度な画像解析を実現している。
産業用画像解析AIに関する考察
東芝が開発した画像解析AIは、少数の実画像データから効率的に学習データを生成できる点で画期的な技術革新といえる。産業現場における画像解析の自動化は人手不足の解消や作業効率の向上に直結するため、製造業や医療分野での活用が期待されるだろう。
今後は異なる産業分野での実証実験を通じて、様々な用途に対する適用可能性の検証が必要となるはずだ。特に医療分野では患者のプライバシー保護と高精度な診断支援の両立が求められており、少数データでの学習が可能な本技術は大きな意味を持つだろう。
東芝デジタルソリューションズとの連携による早期実用化に向けた取り組みにも注目が集まる。産業用画像解析AIの普及は、製造現場のDX推進や医療診断の効率化など、幅広い分野でイノベーションを加速させる可能性を秘めている。
参考サイト
- ^ TOSHIBA. 「学習データが十分にない産業分野においても、少数の実画像による「事前学習」で、迅速かつ高精度に解析する「画像解析AI」を開発 -顕微鏡画像や赤外線画像、生体画像など収集できる画像が少なく、従来AI導入が難しかった専門分野の自動化・省人化に貢献- | 研究開発センター | 東芝」. https://www.global.toshiba/jp/technology/corporate/rdc/rd/topics/24/2412-01.html, (参照 24-12-20).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Discoveryとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- Google WorkspaceがカスタムOIDCプロファイルでのSSO設定機能を追加、クラウドアプリケーションのアクセス管理が柔軟に
- Google Workspaceが管理者向けアカウントリカバリー設定を追加、プライバシー規制対応とセキュリティ強化を実現
- GoogleがAppSheet Admin Consoleを一般提供開始、Workspace管理者のアプリ管理機能が大幅に向上
- グーグルが画像組み合わせ型AIツールWhiskを公開、直感的な操作で独創的な作品生成が可能に
- YouTubeが第三者企業向けAIトレーニング機能を発表、クリエイターによる使用可否の選択が可能に
- GoogleがAI動画生成Veo 2と画像生成Imagen 3を発表、4K動画や多様なアートスタイルの生成が可能に
- GitHubがVisual Studio向けCopilot Freeを公開、AIによる開発効率が25%向上へ
- MicrosoftがWindows 11 Insider Preview Build 26120.2705をリリース、多言語リアルタイム翻訳機能の実装により国際コミュニケーションが向上
- GoogleがProject IDXにGemini統合のInteractive Chatを追加、自然言語による開発効率の向上を実現
- Amazonがふるさと納税サービスを開始、全国約1,000自治体が参画し返礼品の最短翌日配送に対応
スポンサーリンク