エーアイ

公開：2025-03-14

産総研が日本語音声基盤モデル「いざなみ」「くしなだ」を一般公開、少量データでの高性能音声AI構築が可能に

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

IT・テックのコネクトメディア「ゼゼック」
カテゴリ毎のアーカイブ記事一覧
【カテゴリ別】2025年03月のアーカイブ一覧
【2025年03月】AIに関するアーカイブ一覧
【2025年03月11日】AIに関するアーカイブ一覧
産総研が日本語音声基盤モデル「いざなみ」「くしなだ」を一般公開、少量データでの高性能音声AI構築が可能に

スポンサーリンク

関連するタグ

目次

記事の要約
産総研が日本語音声基盤モデル「いざなみ」「くしなだ」を一般公開
日本語音声基盤モデルの性能比較
音声基盤モデルについて
参考サイト

記事の要約

産総研が日本語音声基盤モデル2種を一般公開
「いざなみ」と「くしなだ」がHugging Faceで利用可能
約6万時間の日本語音声データから構築された高性能モデル

スポンサーリンク

産総研が日本語音声基盤モデル「いざなみ」「くしなだ」を一般公開

国立研究開発法人産業技術総合研究所は2025年3月10日、豊かな感情表現を含む6万時間の日本語音声データから構築された2種類の日本語音声基盤モデル「いざなみ」「くしなだ」を一般公開した。これらのモデルは音声AI構築に利用可能で、Hugging Face上で公開されており、少量の音声データでも高性能な音声AIを構築できる基盤を提供している。^[1]

「いざなみ」は利用者のデータを用いて容易に改良可能な特徴を持ち、一方の「くしなだ」は日本語の音声感情認識と音声認識において優れた性能を発揮することが特徴となっている。両モデルの開発により、高齢者の音声や感情豊かな表現を含む会話など、教師データが少量しかない場合でも高性能な音声AIの構築が可能になった。

音声基盤モデルの性能評価では、日本語の演技感情音声における音声感情認識において「いざなみ」で80.12%、「くしなだ」で84.77%という高い正解率を達成している。これらの性能は従来の音声基盤モデルを用いない場合と比較して10ポイント以上の改善を示しており、日本語音声処理における重要な進展となっている。

日本語音声基盤モデルの性能比較

	いざなみ	くしなだ
主な特徴	容易な改良が可能	高い感情認識・音声認識性能
音声感情認識正解率	80.12%	84.77%

モデルのダウンロードはこちら

スポンサーリンク

音声基盤モデルについて

音声基盤モデルとは、音声データを処理・解析するための汎用的なAIモデルのことを指しており、主な特徴として以下のような点が挙げられる。

大規模な音声データから自己教師あり学習で構築可能
音声認識や音声感情認識などに応用が可能
少量の教師データで高性能な音声AIを構築可能

音声基盤モデルは音声データの特性や話者の感情表現を効果的に処理・解析することができる。音声基盤モデルを通じて得られる汎用的な音声の特徴表現を用いることで、少量の音声データと教師データでも高性能の音声AIが構築できるため、介護施設などでの活用が期待されている。

参考サイト

^ 産業技術総合研究所. 「産総研：日本語音声基盤モデル「いざなみ」「くしなだ」を公開」. https://www.aist.go.jp/aist_j/press_release/pr2025/pr20250310/pr20250310.html, (参照 25-03-14).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム

「AI」に関するコラム一覧

「AI」に関するニュース

「AI」に関するニュース一覧

アーカイブ一覧

AIに関する人気タグ

人工知能(2709)

機械学習(2466)

ビッグデータ(788)

画像認識(579)

リアルタイム分析(111)

AIに関するカテゴリ

最新記事

カナリークラウドがLIFULL住まいんど診断と連携開始、不動産仲介業務の効率化と顧客満足度向上を実現

JR西日本がモバイルICOCAのサービス拡大を発表、TOICAとSUGOCAエリアの定期券がスマートフォンで購入可能に

SHIFTが経済産業省のDX認定事業者に選定、データとAI活用で人材育成とビジネス変革を加速

合同会社OblivionがLメンバーズカードの入退室管理システムにチェックイン前フォーム機能を追加、会員データの効率的な収集と活用が可能に

内閣官房が国と地方のデジタル共通基盤構築セミナーを開催、行政DXの推進方針を解説

関連性が高いタグ

デジタル自動化デジタルトランスフォーメーションデジタルネイティブモダナイゼーション

プログラミング

最新記事

paizaラーニングが学校向け管理機能とテスト機能を実装、プログラミング教育の効率化を実現

株式会社RabeeがSvelte×Tailwind CSSのUIコンポーネント集を開発、カスタマイズ性の高いWeb開発環境の実現へ

MicrosoftがVisual Studioの生産性向上機能を公開、ファイルエンコーディング設定など開発効率を改善

ByteDanceがクロスプラットフォーム開発技術Lynxを公開、TikTokでの実績を基に開発効率の向上へ

ByteDanceがクロスプラットフォーム開発技術Lynxを公開、TikTokでの実績を基に開発効率の向上へ

関連性が高いタグ

開発リリース言語テストオープンソース

最新記事

IDDKがKDDIの宇宙共創プログラムに採択、独自開発のMIDを活用した宇宙バイオ実験プラットフォームの構築へ

SecualがシマダハウスにNiSUMU CAREを導入、高齢者の賃貸住宅入居問題の解決に向けた新たな一歩

デンソーソリューションがEV充電制御システムEVECOMを発売、充電インフラ整備の効率化と電力管理の最適化を実現

デンソーソリューションがEV充電制御システムEVECOMを発売、充電インフラ整備の効率化と電力管理の最適化を実現

ゼネテックの位置情報技術が浜松市消防の実証実験に採用、仙台BOSAI-TECHでの紹介で防災DXの進展に期待

関連性が高いタグ

ウェアラブルエッジコンピューティングGPSスマートシティスマートホーム

コンピュータ

最新記事

TOKAIコミュニケーションズがProxmoxVE採用の新プライベートクラウドサービスPracla(PVE)を提供開始、高コストパフォーマンスと高可用性を実現

北浜GRFとAmaryllo社が新会社設立、買い切り型クラウドストレージとGPU時間貸事業で日本市場に参入

サードウェーブがドスパラのGALLERIAで3Dカスタマイズシミュレーターを公開、PCパーツ選びが直感的に

キヤノンがニデックと共同でオフィス向け複合機のCO2排出量を算定、環境ラベルSuMPO EPDで情報開示へ

日本ベネックスが本社FIT太陽光発電所を蓄電池併設FIP発電所へ移行、電力の有効活用と収益最大化を実現

関連性が高いタグ

システムデータプラットフォームネットワーククラウド

スポンサーリンク

ブログに戻る

ALL

トピックス

2024年 10月 13日

エス・エム・エスがケアマネ試験解答速報を提供、ウェルミージョブとケア人材バンクで自己採点ツールも利用可能に

2025年 5月 29日

R/GAと富士通の「Carbon Cakes」がCreative Review Annual Awardsで「Creative Use of Data」賞を受賞

2025年 5月 29日

株式会社ソフィアが新規事業提案制度に関する無料オンラインセミナーを5月29日に開催

2025年 5月 29日

株式会社HATARABAがプロパティマネジメント事業を開始、ビルオーナーの収益最大化を支援

2025年 5月 29日

三井屋工業と鳥取大学、リサイクル培地「ふわっ土」の共同研究開始で農業分野進出加速

2024年10月13日

エス・エム・エスがケアマネ試験解答速報を提供、ウェルミージョブとケア人材バンクで自己採点ツールも利用可能に

2025年5月29日

R/GAと富士通の「Carbon Cakes」がCreative Review Annual Awardsで「Creative Use of Data」賞を受賞

2025年5月29日

株式会社ソフィアが新規事業提案制度に関する無料オンラインセミナーを5月29日に開催

2025年5月29日

株式会社HATARABAがプロパティマネジメント事業を開始、ビルオーナーの収益最大化を支援

2025年5月29日

三井屋工業と鳥取大学、リサイクル培地「ふわっ土」の共同研究開始で農業分野進出加速