公開:

mocomocoが高性能音声認識API「mocoVoice」を提供開始、医療や金融の専門用語にも対応し業務効率化を実現

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)

mocomocoが高性能音声認識API「mocoVoice」を提供開始、医療や金融の専門用語にも対応し業務効率化を実現

PR TIMES より


記事の要約

  • mocomocoがAI音声認識API「mocoVoice」を提供開始
  • 専門用語に対応した高精度な音声認識を実現
  • 個人から企業まで幅広いユーザー向けに展開

mocomocoの高性能音声認識API「mocoVoice」がもたらす新たな可能性

mocomoco株式会社は高性能音声認識AI「mocoVoice API」を2024年11月30日に正式リリースした。OpenAI Whisperをベースに独自の辞書アルゴリズムと高速化技術を組み合わせることで、医療や金融などの専門用語にも対応した高精度な音声認識を実現している。[1]

mocoVoice APIの特筆すべき機能として、読みの指定が不要な辞書登録機能によって業界特有の専門用語や略語への対応が容易になり、より正確な音声認識が可能となった。ChatGPTを活用した文章校正機能により、音声認識後のテキストを自動で校正し高品質な文章を生成することが可能である。

また、Free、Standard、Pro、Enterpriseの4つのプランを用意しており、個人ユーザーから企業ユーザーまで幅広いニーズに対応している。学習ありプランと学習なしプランの2種類を提供することで、プライバシー保護を重視するユーザーにも配慮した柔軟な選択肢を提供することが可能となった。

mocoVoice APIの料金プランまとめ

Free Standard Pro Enterprise
基本料金(円) 0 950 4,980 13,800
書き起こし料金(学習なし/円/分) 0 2.64 2.23 1.73
書き起こし料金(学習あり/円/分) 0 1.98 1.23 1.04
無料枠(分) 300 600 600 600
mocoVoice APIの利用申請はこちら

OpenAI Whisperについて

OpenAI Whisperとは、音声認識業界で最高性能を誇る音声認識モデルのことを指しており、主な特徴として以下のような点が挙げられる。

  • 多言語対応の高精度な音声認識が可能
  • オープンソースで提供されており誰でも利用可能
  • ノイズに強く実用的な音声認識を実現

mocoVoice APIではOpenAI Whisperをベースにし、独自の辞書アルゴリズムと高速化技術を組み合わせることで、より高度な音声認識を実現している。医療や金融などの専門用語に対応した高精度な音声認識が可能となり、業界特有の専門用語や略語にも対応することが可能となった。

参考サイト

  1. ^ PR TIMES. 「mocomoco、高性能音声認識AI「mocoVoice API」提供開始! | mocomoco株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000001.000146901.html, (参照 24-12-03).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
アーカイブ一覧
AIに関する人気タグ
AIに関するカテゴリ
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。