東芝がハイブリッド行動認識AIを開発、少ない計算量で高精度な人物行動認識を実現へ
スポンサーリンク
記事の要約
- 東芝がハイブリッド行動認識AIを開発
- 骨格認識AIと動画認識AIの利点を組み合わせ
- 少ない計算量で高精度な人物行動認識を実現
スポンサーリンク
東芝が開発した新しいハイブリッド行動認識AIの特徴と活用
東芝は2024年10月28日、人物の骨格の動きと1枚の画像を効率的に組み合わせることで人のさまざまな行動を認識できる「ハイブリッド行動認識AI」を開発したと発表した。このAIは独自のアルゴリズムによりカメラ映像から最適な画像を1枚だけ抽出し、骨格の動きと組み合わせることで高精度な認識を実現している。[1]
製造現場のDX推進において、作業効率の分析や作業ミスの検知・防止を目的とした行動認識AIの導入が進んでいるが、既存の手法には課題があった。新開発のハイブリッド行動認識AIは、骨格認識AIの少ない計算量という利点と動画認識AIの高い認識精度を両立している。
公開データセットを用いた評価では、特に持ち物の影響を受けるケースにおいて認識精度が51.6%から89.5%へと大幅に向上した。東芝は本AIの詳細を2024年10月27日から30日にかけて開催されるICIP2024で発表し、今後は東芝グループの工場やViewLEDなどへの実用化を目指している。
ハイブリッド行動認識AIの性能比較まとめ
骨格認識AI | 動画認識AI | ハイブリッド行動認識AI | |
---|---|---|---|
計算量 | 少ない | 膨大 | 少ない |
認識精度 | 51.6% | 高い | 89.5% |
持ち物の判別 | 不可能 | 可能 | 可能 |
スポンサーリンク
行動認識AIについて
行動認識AIとは、カメラ映像から人物の動作や行動を自動的に識別し解析するシステムのことである。主な特徴として、以下のような点が挙げられる。
- 映像データから人物の動きをリアルタイムで検出
- 作業効率の分析や作業ミスの検知に活用可能
- 製造現場のDX推進に貢献
従来の行動認識AIは骨格認識AIと動画認識AIの2種類が存在し、それぞれ特徴が異なっていた。骨格認識AIは計算量が少ないが持ち物の判別が難しく、動画認識AIは高精度だが計算リソースを多く必要とするという課題があった。東芝の新開発AIはこれらの課題を解決している。
ハイブリッド行動認識AIに関する考察
製造現場におけるDXの推進において、作業効率の分析と作業ミスの検知は重要な課題となっており、ハイブリッド行動認識AIの開発は大きな前進となる。特に既存の行動認識AIが抱えていた計算量と認識精度のトレードオフを解消した点は画期的だ。
今後の課題として、リアルタイム処理における安定性の確保や、多様な製造環境への適応能力の向上が挙げられる。製造現場の照明条件や作業者の服装、作業内容の変化などに対して、いかに安定した認識精度を維持できるかが重要になるだろう。
将来的には、AIの学習データの拡充や認識アルゴリズムの更なる改良により、より広範な作業シーンでの活用が期待される。製造現場の生産性向上や品質管理の強化に向けて、ハイブリッド行動認識AIの進化は続くものと考えられる。
参考サイト
- ^ TOSHIBA. 「少ない計算量で高精度に人物の行動を認識する「ハイブリッド行動認識AI」を開発 -「骨格認識AI」と「動画認識AI」を組み合わせ、道具を使った作業を詳細に判別し製造現場のDX推進に貢献- | 研究開発センター | 東芝」. https://www.global.toshiba/jp/technology/corporate/rdc/rd/topics/24/2410-01.html, (参照 24-10-29).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VGG(Visual Geometry Group)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Windows 11 Insider Preview Build 26120.2200がDev Channelで公開、Studio EffectsとDynamic Lightingの機能強化でユーザビリティが向上
- GoogleがGemini appをWorkspaceのコアサービスに追加、エンタープライズグレードのデータ保護機能で安全性が向上
- 【CVE-2024-30159】MiCollabにクロスサイトスクリプティングの脆弱性が発見、情報漏洩のリスクに警告
- 【CVE-2024-30158】MiCollab 9.7.1.110にSQLインジェクションの脆弱性、情報漏洩のリスクで早急な対応が必要に
- 【CVE-2024-45334】トレンドマイクロのantivirus oneに重大な脆弱性、情報漏洩のリスクに早急な対応が必要
- 【CVE-2024-49209】archerirmのarcherに不正認証の脆弱性、情報改ざんのリスクで対策が必要に
- 【CVE-2024-21261】Oracle Application Express 23.2と24.1に脆弱性、情報セキュリティリスクへの対応が必要に
- 【CVE-2024-38814】VMware HCX 4.8.0-4.10.0にSQLインジェクションの脆弱性、情報漏洩のリスクで早急な対応が必要に
- 【CVE-2024-47715】Linux Kernelに不特定の脆弱性、複数バージョンでDoS攻撃のリスクが発生
- 【CVE-2024-49236】WordPress用プラグインcrazy call to action boxにクロスサイトスクリプティングの脆弱性、情報漏洩のリスクに警戒
スポンサーリンク