例えば、テキスト領域の作業は生成AIの利用が急速に増えています。
しかし「自動文字起こしアプリ」には有料で提供されているものが多く、事業規模や業種によっては、なかなか導入まで至らないといったケースもあるでしょう。特にMac OSで利用できる「自動文字起こしアプリ」は、全体の数もそれほど多くありません。そこで今回は、Macユーザーにおすすめの無料で利用できる「自動文字起こしアプリ」について解説していきます。
目次
自動文字起こしアプリを利用するための事前知識
おすすめの自動文字起こしアプリを紹介する前に、いくつか知っておきたい事前知識を説明します。▶自動文字起こしアプリの種類
自動文字起こしアプリの種類は、大きくわけて、録音した音声・動画ファイルを使って文字起こしを行うタイプと、リアルタイムに音声を記録するタイプに分かれます。両方の機能を備えたアプリもありますが、今回は録音した音声ファイルで文字起こしが可能なツールを中心にアプリを紹介します。
▶一部の自動文字起こしアプリで必要な事前準備
一部の自動文字起こしアプリでは、正確な文字起こしをするために、Mac端末内に仮想のオーディオデバイスを作成する機能拡張ソフトをインストールし、Macでの音声ルーティングを変更(音の入力、処理、出力の経路設定を意図的に変更)する必要があります。これは、スピーカーから出力する音声をもとに自動文字起こしアプリが音声を読み取るのではなく、Mac内での音声処理を優先するように設定する必要があるためです。仮想オーディオデバイスを経由することで、ノイズの影響を受けにくい音声を処理できるようになります。
この仮想オーディオデバイスソフトには「Soundflower」や「BlackHole」といったものがあります。これらのデバイスにはサラウンドシステムのチャンネル(ch)によってバージョンが複数提供されていますが、特に音質にこだわる必要がなければ任意のバージョンをダウンロードしてください。

以下、「Soundflower」や「BlackHole」について表にまとめましたので参照してください。
MacOS用の仮想オーディオデバイス
ソフト名説明SoundflowerMac OS用の仮想オーディオデバイス。擬似的なスピーカーやマイクを仮想構築し音声を処理することが可能。M1モデルに移行してから一時期利用できなくなっていたが、現在は復活している。BlackHoleMac OS用の仮想オーディオデバイス。M1モデルに移行後使えなくなっていたSoundflowerの代用として注目される。Intel Macにも対応している。
おすすめの文字起こしアプリ5選
自動文字起こしアプリには、トライアルも含めて無料で利用できるサービスが数多くあります。しかし、日本語非対応だったり、無料利用での制限が厳しく、実質は課金しないとほぼ使い物にならないといったサービスが大半です。ここでは、ライターである私が実際に使ってみて、十分に業務で利用可能であると判断したサービスを厳選して紹介します。1.writer.app

デメリットは、正確な文字起こしのために、仮想オーディオデバイスをインストールが必要となるのと、精度はそこまで高くない点になります。また、倍速で再生するモードなどはありますが、音声・動画データの収録時間と同じ時間が、文字起こしにかかります。
時間制限なく利用可能な無料の文字起こしツールを探している企業はもちろんのこと、インタビューの文字起こし作業を多数抱えているけれども、自動文字起こしにコストをかけることができないフリーランスのライター・編集者などにおすすめのアプリです。
writer.appURL:https://writer.app/
2.CLOVA Note

利用方法も簡単で、LINEからログイン後、音声データをアップロードするだけで、数分で文字起こしデータが作成されます(音声ルーティングを変更も不要)。また、精度が高く話者も識別されます。
現在はまだベータ版ですが、無料期間がいつまで続くかが不透明で、サービス自体が停止や縮小といった展開もありえるという点はデメリットです。加えて、LINEヤフーは度重なる情報漏洩により総務省から行政指導を受けているので、同社の秘密保持やセキュリティ対策が心配という方にはおすすめできません。そうしたマイナス面を勘案しても、個人ユーザーで普段からLINEを利用しているのであれば、イチオシの文字起こしアプリだと思います。
CLOVA NoteURL:https://clovanote.line.me/
3.Googleドキュメント

ただし「writer.app」と同様に、こちらも文字起こしには音声データの時間と同じ時間を要します。また、音声ファイルをプレイヤーで流して文字起こしする場合は、音声ルーティングの変更をしないと、なかなか上手く音声を読み取ってもらえません。さらに、現段階では専用の文字起こしアプリと比べると、やや精度が落ちる気がします。加えて、注意点としては、Googleドキュメントを開いているブラウザを前面に配置しておく必要があるので、他の作業をしながらバックグラウンドで文字起こしできないのがデメリットです。
いくつか不便な点はあるものの、Googleの生成AI技術は、熾烈な競争の中で日々進歩してますので、今後さらに使い勝手がよくなる可能性が高いツールであると考えられます。
GoogleドキュメントURL:https://docs.google.com/
4.Speechy Lite

音声ファイルからの文字起こしもできますが、話者が複数人いる場合の取材音源で試したところ、精度はあまり高いとは言えませんでした。おそらく議事録などよりも、1対1の取材の際に取材対象者の声がよく拾えるようにiPhoneを置いて利用するといった利用方法のほうが性能を活かせるような気がします。
ボイスレコーダーを使いながら、スマホの録音アプリで予備の録音をするといったスタイルで取材している方も多いと思いますが、リアルタイムで文字起こしもしてくれる録音アプリだと考えると大変便利なツールであることが分かると思います。また、口述筆記や語学学習などにも向いているので、様々な活用シーンが想定できるのも魅力です。
Speechy LiteApp Storeのページ:Speechy Lite
5.ユーザーローカル音声議事録システム

Chrome、Edge、Safariといった主要なブラウザに対応しているので、幅広い端末環境で利用できます。ただし、ネットに接続されていないと利用できないサービスですので、基本的にはオフィスや自宅での利用を想定しておきましょう。
ユーザーローカル音声議事録システム公式サイト:ユーザーローカル音声議事録システム
知っておきたい有料の自動文字起こしアプリ
取引先、クライアントなどが有料の自動文字起こしアプリを導入しているといったケースも、今後増えてくると予測されます。特にフリーランスのライター・編集者・デザイナーなどは、文字起こしデータの受け渡しで有料のアプリを利用する機会がある可能性が高いでしょう。以下の一覧表に、代表的な有料の自動文字起こしアプリをまとめましたので、補足情報として参考にしてください。代表的な有料の文字起こしアプリ一覧表
ツール名説明RIMO voice日本語に特化した非常に精度が高く人気の高い自動文字起こしアプリ。1時間の音声データを約5分で文字起こし可能。音声だけでなく動画ファイルにも対応。テキストのタイムスタンプをクリックすると、その部分の音声を再生することことが可能なのも便利。導入する出版社やWebメディアも増えてきている。
自動文字起こしアプリに関する今後の動向
▶企業での導入は増加する議事録や取材・インタビュー以外にもオンライン教育、カスタマーサポート、メディア・エンターテイメント、法律・医療などの領域でも自動文字起こしアプリの導入が進んでいくと考えられます。
▶ローカル端末に標準搭載された自動文字起こし機能の普及が進む
現在は、クラウド上で処理される生成AIが主流ですが、先日のWWDC24で発表された「Apple Intelligence」のように、今後はローカル端末に標準搭載された生成AIによる自動文字起こしの普及が進むと予測され、次のiOS 18でもAIでの書き起こし機能が搭載されると発表されています。また、Google Pixelにも同様の文字起こし機能が搭載されています。Mac OSにも自動文字起こし機能が近いうちに標準搭載されるかもしれませんので、自動文字起こしアプリの動向は過渡期で、今後大きく変動する可能性もあることを留意しておきましょう。
参考記事:iPhoneの電話アプリが通話録音に対応、AIで書き起こし・要約も生成。iOS 18のApple Intelligenceで(TechnoEdge)
自動文字起こしアプリを使う上での注意点
自動文字起こしアプリの中には、音声データをサーバーに保存して処理するものがあります。仮に、サービス提供者の対策が不十分であった場合、情報が漏洩する可能性もあります。そのため、社外秘の開発関連事項など機密性の高い情報が含まれた音声データはアップロードしないように心がける必要があります。また、利用規約やプライバシーポリシーを確認し、セキュリティ対策がしっかりしているサービスを選択するようにしましょう。加えて、生成AIに否定的な立場の方も多いので取材相手などには事前に自動文字起こしアプリを利用しても良いか許可をとっておくことも重要になってくるでしょう。
まとめ
クリエイターが現在の不正な学習データを含む生成AIに不安を抱くことは当然のことですが、業務で生成AIが欠かせない存在になっているビジネスパーソンとの温度差が大きく乖離していくことも問題です。自分の担当する業務や置かれた立場によって、生成AIとの向き合い方は千差万別だと思いますが、そんな中で取り入れていくべき生成AIと、批判していくべき生成AIはどこかで折り合いをつける必要があるのではないでしょうか。例えば、雑誌メディアが全盛期の頃は、文字起こし作業とライティングは分業化されていた出版社も多かったと聞いています。それが、出版業界が縮小する中でライターが文字起こしも担当するのが当たり前になって現在に至っている訳ですが、自動文字起こしアプリの興隆で以前のライティングのみに集中できるスタイルに戻りつつあることは、歓迎すべき事柄ではないでしょうか。文書作成を生業にする者にとって生成AIは脅威ですが、取材記事作成スキルをもった人材にはプラスに作用している側面もあると思います。また、クライアント側も単価を抑えつつ、スキルが高いライターを採用できる可能性を高めることもできます。
本記事で紹介した自動文字起こしアプリはITインフラとして今後の業務を支える基盤となる技術かもしれませんので、一次体験としてぜひ本記事で紹介したアプリを使ってみてください。
