音声モードはChatGPTと音声でやりとりするモードで、「高度な音声モード」は、今年5月にOpenAIがマルチモーダルAIモデル「GPT-4o」を発表した際にライブデモを公開した進化版だ。
すべての対象ユーザーへの展開には約1週間を要する見通しだ。使用できるようになると、ChatGPTアプリに通知が表示される。音声モードでは会話中にChatGPTの画面の中央に白い円が表示されるが、高度な音声モードではそれが青い円のアニメーションとなる。
広範囲への提供開始とともに、いくつかの機能追加も行われた。
まず、新たに、Arbor(男性)、Maple(女性)、Sol(女性)、Spruce(男性)、Vale(女性)の5つの声が追加され、合計9つの声を選べるようになった。
そして、「カスタム指示」と「メモリ」を使用できるようになった。これらはChatGPTとのやりとりを自然かつ効率的にするのに役立つ機能である。
「カスタム指示」は、ChatGPTの応答スタイルや会話の進め方をユーザー向けにカスタマイズできる機能で、設定画面で指示を入力する。たとえば、「ゆっくり、フレンドリーに話して」というように話し方や口調を指示する。また、自身の情報をChatGPTに伝えておくことで、コンテキストに沿った会話が可能になる。
音声機能についても、アルファ版リリース以降、会話のスピードやなめらかさ、状況の判断、一部外国語のアクセントの理解などが向上したと報告している。