DNPが環境音のテキスト化機能をスマートグラスに実装、聴覚障がい者の情報アクセシビリティ向上に貢献
スポンサーリンク
記事の要約
- DNPが音声のテキスト化機能をスマートグラスに実装
- 環境音を擬音語・擬声語でリアルタイム表示
- 2025年1月に聴覚障がい者向け体験会を開催
スポンサーリンク
DNPが音声認識システムを活用した新機能をスマートグラスに実装
大日本印刷株式会社(DNP)は、アイシンの音声認識システム「YYSystem」を活用し、周囲の環境音などを擬音語・擬声語としてスマートグラスにテキスト表示する機能を実装した。DNP独自の「DNP感情表現フォントシステム」を組み合わせることで、認識した音の感情やイメージに合わせて文字のフォントや色が自動的に切り替わる仕組みを構築している。[1]
開発の背景には、母語の違いや障がいの有無、年齢などの多様性に配慮した「ユニバーサルコミュニケーション」へのニーズの高まりがある。特に観光地や展示会などにおいて、自治体や企業・団体からの要望が増加しており、聴覚障がい者や音が聞こえにくい状況下での情報提供手段として期待が寄せられている。
新機能の検証として、スマートグラス「XREAL Air 2 Ultra」を使用した「音が見える!字幕表示メガネでオノマトペ体験会」を2025年1月24日から26日にかけて新宿NSビルと新宿中央公園で開催する予定だ。各日とも午前の部と午後の部の2回に分けて実施され、聴覚障がい者を主な対象として有用性や課題を検証する。
DNPのスマートグラス新機能まとめ
環境音認識 | フォント表現 | 利用シーン | |
---|---|---|---|
主な機能 | 10種類の擬音語・擬声語を表示 | 感情に合わせたフォント自動切替 | 観光地や展示会での活用 |
対象音 | 救急車サイレン、横断歩道案内音 | 自然音、動物の鳴き声 | 環境音全般 |
スポンサーリンク
DNP感情表現フォントシステムについて
DNP感情表現フォントシステムとは、テキストの内容が持つ感情やイメージに応じて最適なフォントや色を自動的に選択するシステムのことを指す。主な特徴として以下のような点が挙げられる。
- テキストの感情分析に基づくフォント選択
- 環境音に応じた自動的なフォント切り替え
- 機械学習による音声認識精度の向上
DNPは2024年1月から観光スポットや展示施設での解説音声を字幕化するシステムを開発している。今回の環境音認識機能の追加により、より幅広い音声情報の視覚化が可能となり、聴覚障がい者のコミュニケーション支援ツールとしての活用が期待されている。
スマートグラスの音声テキスト化機能に関する考察
DNPのスマートグラス新機能は、聴覚障がい者の日常生活における情報アクセシビリティを大きく向上させる可能性を持っている。特に救急車のサイレンや横断歩道の案内音といった安全に関わる音の可視化は、バリアフリー社会の実現に向けた重要な一歩となるだろう。
今後の課題として、環境音の認識精度の向上や、騒音が多い環境下での正確な音声判別が挙げられる。これらの課題に対しては、機械学習モデルの継続的な改良や、複数のセンサーを組み合わせたマルチモーダル認識システムの導入が有効な解決策となり得るだろう。
将来的には、多言語対応や環境音以外の音声情報の視覚化など、機能の拡充が期待される。特に観光地での活用を考えると、各地域特有の音や案内放送なども認識対象に加え、よりきめ細かな情報提供が可能になることが望ましい。
参考サイト
- ^ DNP 大日本印刷株式会社. 「周囲の音を視覚化してスマートグラスに表示する機能を実装 | ニュース | DNP 大日本印刷」. https://www.dnp.co.jp/news/detail/20176109_1587.html, (参照 24-12-11).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Discoveryとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- GoogleがGemini LTIを教育機関向けに公開、Canvas by InstructureとPowerschool Schoology Learningで利用可能に
- Herokuが次世代クラウドネイティブ技術スタックFirを発表、オープンソース標準技術の採用で開発者体験を向上
- シャープとKDDIが堺工場跡地でAIデータセンター構築に合意、2025年度中の本格稼働を目指し基本合意書を締結
- キャリアサバイバルが低価格AIツール開発サービス「かんたんAI開発」を提供開始、10万円からのテンプレート活用でDX推進を加速
- STARTO ENTERTAINMENTがチケット転売サイト2社への情報開示請求進捗を報告、法的対応を本格化へ
- 東京メトロが丸ノ内線全線にCBTCシステムを導入、日本の地下鉄初の無線式列車制御で運行安定性が向上
- Box Japanが生成AI活用の意識調査を実施、95%の運用担当者が活用に不安を感じていることが判明
- ラックがセキュリティ監視センターJSOCの次世代戦略を発表、AIと脅威インテリジェンスを活用した新サービスを2025年4月より提供開始
- 京大病院とDISCOVERYがHAE患者予測AIモデルの検証を完了、電子カルテデータで有用性を確認
スポンサーリンク