AITalk6ではAITalk5で搭載した「DNN音声合成方式」の検証や新たな学習を積み重ね、品質改善を行った結果、より自然性の向上した音声合成を実現しました。
[画像: https://prtimes.jp/i/99620/49/resize/d99620-49-a620b3bd0d65f26fd99b-0.png ]
主な改善ポイント
1.音声生成法の変更(ボコーダーからニューラルボコーダーへ)
信号処理による音声生成法(ボコーダ)をニューラルネットワークによる音声生成法(ニューラルボコーダ)に変更する事により、より自然で肉声感のある音声を合成できるようになりました。
2.ニューラルネットワークの構造変更
AITalk5では、軽量で高速な処理を実現するため音声特徴量を生成するニューラルネットワークは簡素な構造を採用していました。
今回AITalk6で採用したニューラルネットワークは、韻律モデルと音響モデルを統合し、音素や時間フレームの情報を短期や長期で考慮する構造を採用することで、従来よりも自然な音声に近い音声特徴量を生成できるようになりました。
実際の変化につきましては、以下より音声をご確認下さい。
https://www.ai-j.jp/topics/9371/
AITalk6の製品展開について
今後、以下の製品・サービスに順次展開してまいります。
・A.I.VOICE
・AITalkSDK
・AITalkServer
・AICloudサービス
・Editor製品
企業プレスリリース詳細へ
PR TIMESトップへ