AmiVoice(R) 音声認識APIに双方向型のディープラーニング技術「Bi-LSTM」を実装　領域特化型エンジンの認識率が大幅向上

2020年09月17日(木) 16:15

AmiVoice(R) 音声認識APIに双方向型のディープラーニング技術「Bi-LSTM」を実装　領域特化型エンジンの認識率が大幅向上

株式会社アドバンスト・メディア（本社：東京都豊島区、代表取締役会長兼社長：鈴木清幸以下、アドバンスト・メディア）は、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform（アミボイスクラウドプラットフォーム）」をアップデートし、双方向型のディープラーニング技術「Bi-LSTM（Bidirectional Long Short-Term Memory）」を音声認識エンジンに実装しました。これによりエラー改善率が最大で25%（当社調べ）と、自然発話を中心とした認識率が大幅に向上しました。

https://acp.amivoice.com/main/

Bi-LSTMは、ディープラーニングの発展技術の一つです。従来の音声認識エンジンAmiVoiceに実装していた、リカレントニューラルネットワーク技術の「LSTM（Long Short-Term Memory）」は、過去の情報を加味しながら処理を行いますが、「Bi-LSTM」は未来の情報を予測し加える事で、双方向の時間軸から処理を行います。その為、更に高い認識率を実現する事が可能になりました。

[画像1: https://prtimes.jp/i/20223/216/resize/d20223-216-271478-1.png ]

この度「AmiVoice Cloud Platform」で提供している、全ての領域特化型の音声認識エンジンに「Bi-LSTM」を実装しました。「LSTM」を実装したこれまでの音声認識エンジンと比較し、リアルタイム認識で最大20%、バッチ認識で最大25%のエラー改善率となり、認識率が大幅に向上しました。

【Bi-LSTMを搭載した音声認識API】

[表1: https://prtimes.jp/data/corp/20223/table/216_1.jpg ]

[画像2: https://prtimes.jp/i/20223/216/resize/d20223-216-326250-0.png ]

【AmiVoice Cloud Platform】

[表2: https://prtimes.jp/data/corp/20223/table/216_2.jpg ]

アドバンスト・メディアでは、「AmiVoice Cloud Platform」を軸とした音声認識のオープンプラットフォーム化を進めております。AmiVoice 音声認識APIをご利用いただく事で、従来の音声認識開発に要する時間を大幅に短縮するとともに、高い認識精度の音声認識エンジンを簡単に組み込む事が可能になります。
今後も、様々な領域特化型の音声認識APIの公開や随時アップデートを継続していきます。

以上

【お問合せ】
株式会社アドバンスト・メディア PF D&O部
MAIL : info@advanced-media.co.jp
TEL：03-5958-1034
FAX：03-5958-1033

企業プレスリリース詳細へ
PR TIMESトップへ

編集部おすすめ