NishikaのSecureMemoがsilkファイル形式に対応、WeChat等のボイスメッセージの文字起こしが可能に

PR TIMES より
記事の要約
- NishikaがSecureMemoでsilkファイル形式の文字起こしに対応
- オフライン環境で高セキュリティな音声データ処理が可能
- 約100言語に対応し中国語音声の日本語翻訳にも対応
SecureMemoがsilkファイル形式対応で音声文字起こしの利便性向上
Nishika株式会社は、AI音声文字起こしソフトウェア「SecureMemo」において、WeChat等のチャットツールで使用されるsilkファイル形式に対応した文字起こし機能を2025年1月29日にリリースした。silkファイル形式は様々な音声通信プラットフォームで採用されており、この対応により中国語のボイスメッセージなど多様な音声データの効率的な文字起こしが可能になるのだ。[1]
SecureMemoはsilkファイル形式の音声データをオフライン環境で処理することにより、データが外部に送信されることなく安全な環境での利用を実現している。高機密情報を扱う業務でも安心して使用できる設計により、企業における音声データの活用範囲が大幅に広がることが期待されるだろう。
さらにSecureMemoは約100言語に対応しており、中国語の音声の文字起こしや日本語への翻訳機能も搭載している。独自開発の音声認識AI「shirushi」による96.2%の高精度な文字起こしと、オンプレミス環境での生成AI要約機能により、ビジネスコミュニケーションの効率化に大きく貢献することになった。
SecureMemoの主な機能まとめ
項目 | 詳細 |
---|---|
対応ファイル形式 | silkファイル形式(WeChatなどのボイスメッセージ) |
セキュリティ | オフライン処理による高セキュリティ環境 |
精度 | 音声認識精度96.2% |
対応言語 | 約100言語 |
主要機能 | 文字起こし、自動要約生成、話者識別、多言語翻訳 |
silkファイル形式について
silkファイル形式とは、音声データの圧縮フォーマットの一つであり、主にチャットアプリケーションのボイスメッセージ機能で使用される規格のことを指す。主な特徴として、以下のような点が挙げられる。
- 高品質な音声を維持しながら効率的なデータ圧縮が可能
- WeChat等の主要なチャットツールで広く採用
- 音声通信プラットフォームとの高い互換性
SecureMemoがsilkファイル形式に対応したことで、WeChat等のチャットツールで保存されたボイスメッセージの文字起こしと翻訳が可能になった。多国籍企業におけるコミュニケーションのテキスト化や、日本語での解読・検索など、ビジネスシーンでの活用が期待される。
SecureMemoのsilkファイル形式対応に関する考察
SecureMemoによるsilkファイル形式への対応は、グローバルビジネスにおけるコミュニケーション効率化という観点で画期的な進展である。特にWeChat等のチャットツールを利用した国際的なビジネスコミュニケーションが増加している現状において、音声メッセージの文字起こしと翻訳の自動化は、言語の壁を超えた円滑な情報共有を実現するだろう。
一方で、音声認識技術の精度向上や多言語対応の拡充など、継続的な技術革新が求められる課題も存在している。特に方言や専門用語、ノイズが混在する実際のビジネス会話における認識精度の向上が重要だ。今後は音声認識AIのさらなる学習データの蓄積と、生成AI技術の発展により、これらの課題が解決されることが期待される。
SecureMemoの今後の展開として、リアルタイムでの音声文字起こしや、より多くの音声ファイル形式への対応が望まれる。ビジネスコミュニケーションのデジタル化が加速する中、企業の生産性向上に寄与する新機能の追加に期待が高まっている。
参考サイト
- ^ PR TIMES. 「AI音声文字起こしソフトウェア「SecureMemo」、WeChat等のチャットツールで利用されるsilkファイル形式に対応 | Nishika株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000042.000052152.html, (参照 25-01-30).
※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。
- YOLO(You Only Look Once)とは?意味をわかりやすく簡単に解説
- XAI(説明可能なAI)とは?意味をわかりやすく簡単に解説
- Word2vecとは?意味をわかりやすく簡単に解説
- WideResNetとは?意味をわかりやすく簡単に解説
- WebSphereとは?意味をわかりやすく簡単に解説
- VGG(Visual Geometry Group)とは?意味をわかりやすく簡単に解説
- VisionTransformerとは?意味をわかりやすく簡単に解説
- W3C(World Wide Web Consortium)とは?意味をわかりやすく簡単に解説
- Watsonとは?意味をわかりやすく簡単に解説
- Watson Assistantとは?意味をわかりやすく簡単に解説
- 【CVE-2025-21178】Visual Studioに深刻な脆弱性、複数バージョンでリモートコード実行のリスク
- 【CVE-2025-21261】Windows Digital Mediaに権限昇格の脆弱性、物理アクセスで高権限の取得が可能に
- 【CVE-2025-21284】Windowsの仮想TPMにDoS脆弱性が発見、複数のバージョンで対策パッチの適用が必要に
- 【CVE-2025-21403】MicrosoftのOn-Premises Data Gatewayに情報漏洩の脆弱性、バージョン3000.246未満に影響
- ビズリーチが社内版ビズリーチ byHRMOSを発表、生成AI活用で人材流出防止と社内人材活用を効率化
- LINE WORKSがCLOVA Noteβから正式版へのデータ移行サービスを開始、2月4日から一部機能の制限も実施
- HPEがPrivate Cloud AIとVM Essentialsの提供開始を発表、生成AIアプリケーションの短時間立ち上げと仮想化機能の効率化を実現へ
- リッジアイが異常検知AIソリューションRidge Inspectionを提供開始、感性評価AIで定性的判断の定量化を実現
- NECと大塚商会が生成AI基盤を共同開発、美琴 powered by cotomiで業務効率化を促進
- テクマトリックスがSOAtest/Virtualize 2024.2を販売開始、LLM連携機能とIoT対応を強化しテスト効率が向上へ