mocomoco株式会社がmocoVoice APIを発表、100言語対応とコードスイッチ機能で多言語コミュニケーションが効率化
PR TIMES より
スポンサーリンク
記事の要約
- mocoVoice APIが100種類の言語に対応開始
- コードスイッチ機能による複数言語の自動認識を実装
- 多言語対応と話者分離機能を全プランで無料提供
スポンサーリンク
mocoVoice APIの多言語対応とコードスイッチ機能の実装
mocomoco株式会社は高性能音声認識AI「mocoVoice API」において、韓国語や中国語、スペイン語など99種類の新たな言語対応を2024年12月25日より開始した。この拡張によって従来の日本語と英語に加え、世界各地の主要言語での音声認識が可能となり、グローバルビジネスにおける多言語コミュニケーションの効率化が実現されている。[1]
mocoVoice APIには複数言語間のコードスイッチ機能が実装され、会話中の言語切り替えを自動で検出することが可能になった。国際会議や海外拠点とのミーティングなど、多言語が混在する場面での議事録作成を効率的に支援する仕組みが整備されたのだ。
また、OpenAI Whisperをベースにした音声認識技術と独自の辞書機能を統合することで、専門用語や固有名詞の認識精度を向上させている。独自辞書への用語登録時には読みの指定が不要で、音声ファイルだけでなく動画ファイルからの音声抽出にも対応するなど、利便性の向上が図られた。
mocoVoice APIの新機能まとめ
項目 | 詳細 |
---|---|
対応言語数 | 100種類(日本語・英語に加え99言語を追加) |
主要対応言語 | 韓国語、中国語、スペイン語、ドイツ語、フランス語など |
コードスイッチ機能 | 複数言語の自動検出と適切な文字起こしに対応 |
基盤技術 | OpenAI Whisperと独自の辞書機能を統合 |
追加機能 | 話者分離、動画ファイルからの音声抽出に対応 |
スポンサーリンク
コードスイッチについて
コードスイッチとは、一つの会話の中で複数の言語を切り替えて使用する言語現象のことを指す。主な特徴として、以下のような点が挙げられる。
- 会話中に自然な形で言語が切り替わる現象
- バイリンガルやマルチリンガルの話者に多く見られる特徴
- グローバルビジネスや多文化コミュニケーションで頻繁に発生
mocoVoice APIではこのコードスイッチに対応することで、国際会議や多国籍チームでのコミュニケーションをより正確に記録することが可能になった。複数の言語が混在する音声を自動で認識し、各言語に適した形で文字起こしを行うことで、グローバルビジネスの効率化に貢献している。
mocoVoice APIの多言語対応に関する考察
mocoVoice APIの多言語対応は、グローバルビジネスにおけるコミュニケーションの効率化という観点で大きな意義を持っている。特にコードスイッチ機能の実装により、これまで人手に頼らざるを得なかった多言語ミーティングの議事録作成が自動化され、業務効率の大幅な改善が期待できるだろう。
一方で、方言や専門用語、ビジネス特有の略語など、特殊な表現への対応が今後の課題となる可能性がある。業界や地域によって異なる専門用語や表現方法をどこまで正確に認識できるか、独自辞書機能の拡充や学習データの蓄積が重要になってくるだろう。
また、音声認識の精度向上と並行して、セキュリティ面での配慮も必要不可欠だ。国際会議や企業間のコミュニケーションには機密情報が含まれることも多く、データの暗号化や保護機能の強化が求められる。
参考サイト
- ^ PR TIMES. 「高性能音声認識AI「mocoVoice API」が複数言語対応を開始! | mocomoco株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000004.000146901.html, (参照 24-12-26).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- Watson Discoveryとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- WaveNetとは?意味をわかりやすく簡単に解説
- Watson Visual Recognitionとは?意味をわかりやすく簡単に解説
- アサヒグループ本社ビルがCASBEE不動産評価認証で最高位Sランクを取得、環境配慮と安全性が高評価
- シグマ・インターナショナルが不動産登記簿謄本のPDF変換システムを提供開始、AIとテキストマイニング技術で高精度な解析を実現
- Starleyがおしゃべりアプリ「Cotomo」の開発強化に向け約2億円を追加調達、累計調達額が10億円に到達
- AIQとUPDATERがエシカル経済圏創出に向け連携、プロファイリングAIを活用したマーケティング支援を開始
- Exa Enterprise AIがexaBase IRアシスタントにAI分析機能を実装、IR業務の90%以上の効率化を実現
- マウザーがEzurioのTungsten510 SMARC SOMの取り扱いを開始、高性能な組み込みコンピューティングの実現に貢献
- 大成株式会社がアバター警備ロボットugo TSシリーズを関西国際空港で実証実験、AIによる自律走行で警備業務の効率化へ
- アタムアカデミーが小中高生向けオリジナルアバター制作講座を開始、イラスト技術と社会性の向上を目指す新カリキュラムを展開
- ネオステージがMediCo Searchの機能を拡充、医療法人の財務分析と二次医療圏平均の比較が容易に
スポンサーリンク