アリババクラウド、音声認識モデル「Qwen3-ASR-Flash」公開　精度でGoogleやOpenAIを凌駕

2025年09月23日(火)11:30

アリババクラウド、音声認識モデル「Qwen3-ASR-Flash」公開　精度でGoogleやOpenAIを凌駕

中国アリババグループ傘下のアリババクラウドは9月8日、最新の音声認識モデル「Qwen3-ASR-Flash」を発表した。同モデルは、中国語や英語、フランス語、日本語など11言語と多様なイントネーションに対応する。

アリババクラウドの「ModelScope」のほか、「HuggingFace」などのオープンソースプラットフォームを通じて無料で利用できる。

推論コスト、DeepSeekの3分の1に⋯世界を揺らすアリババ「Qwen3」、オープンソースLLMで“最強“評価

Qwen3-ASR-Flashは大量のマルチモーダルデータと数千万時間分の自動音声認識（ASR）データに基づいて構築されており、言語を自動識別し、無音の部分や背景ノイズの部分などを自動的にフィルタリングする。

ASRモデルのベンチマークテストの結果、Qwen3-ASR-Flashは方言や多言語、重要情報、歌詞などの音声認識のエラー率が、グーグルの「Gemini-2.5-Pro」やOpenAIの「GPT-4o-Transcribe」、バイトダンスの「豆包（Doubao）ASR」などを大幅に下回った。

アリババクラウド、音声認識モデル「Qwen3-ASR-Fla...の画像はこちら >>

Qwen3-ASR-Flashについては、多様なノイズ、多言語、方言、専門用語の認識など、さまざまなデモ例が公開されている。たとえば、英語や日本語など5つの言語を含む音声を正確に文字起こしできるほか、アカペラと伴奏付きの楽曲の歌詞の書き起こしにも対応しており、研究者の実測によるエラー率は8％を下回った。

アリババクラウド、音声認識モデル「Qwen3-ASR-Flash」公開　精度でGoogleやOpenAIを凌駕

（36Kr Japan編集部）

編集部おすすめ

36Kr Japanの記事をもっと見る

トピックス

今年亡くなった父への思い語る

今年亡くなった父への思い語る

今日の主要ニュース

除染土の最終処分に向けて

除染土の最終処分に向けて

国内の主要ニュース

仏もパレスチナ国家承認 G7で3カ国目

仏もパレスチナ国家承認 G7で3カ国目

海外の主要ニュース

ドリフのトリビアドリビアさぐる

ドリフのトリビアドリビアさぐる

芸能の主要ニュース

デンベレバロンドール初受賞

デンベレバロンドール初受賞

スポーツの主要ニュース

「刃牙」刃牙＆勇次郎の力強さを纏え!!! “炭酸抜きコーラ”Tシャツもおしゃれ♪ 「glamb」コラボアパレル登場

「刃牙」刃牙＆勇次郎の力強さを纏え!!! “炭酸抜きコーラ”Tシャツもおしゃれ♪ 「glamb」コラボアパレル登場

トレンドの主要ニュース

□に漢字を入れて4つの熟語を完成させよう

□に漢字を入れて4つの熟語を完成させよう

おもしろの主要ニュース

【漫画】「私が部長に言えば居場所がなくなる」そんな脅迫には屈しない！【血液型マウント Vol.55】

【漫画】「私が部長に言えば居場所がなくなる」そんな脅迫には屈しない！【血液型マウント Vol.55】

コラムの主要ニュース

漫画「借金を隠したまま結婚し…

漫画「借金を隠したまま結婚し…

特集・インタビューの主要ニュース

国際総合ニュースランキング

もっと見る

Amazonおすすめランキング PR

世界史

更新:2024-09-10 14:44

Amazonでもっと見る

外交・国際関係

更新:2024-09-10 14:44

Amazonでもっと見る

洋書

更新:2024-09-10 14:44

Amazonでもっと見る

ドキュメンタリー

更新:2024-09-10 14:44

Amazonでもっと見る

お買いものリンク PR