ChatGPTの「高度な音声」モードがビジュアル対応、スマホ画面シェアで対話する機能も

2024年12月13日(金)12:28

ChatGPTの「高度な音声」モードがビジュアル対応、スマホ画面シェアで対話する機能も

米OpenAIは12月12日（現地時間）、「ChatGPT」の「高度な音声」モードにビジュアル機能とサンタ・モードを追加することを発表した。

ビジュアル機能は、ChatGPTアプリ（iOS、Android）で「高度な音声」モード使用時に、ユーザーがカメラで撮影しているビデオストリーミングからの情報も、ChatGPTとの対話に反映できる機能である。

AIとの対話に言葉に加えて視覚的な情報が加わることで、AIの文脈の理解が向上し、視覚情報に基づいた情報提供（花の種類を特定など）やアシスタント（ユーザーの雰囲気に合ったファッションの提案など）、高度なデータ分析、スムーズなコミュニケーションなどが可能になる。

今年5月にOpenAIが「GPT-4o」を発表した際に、「高度な音声」モードで実現する機能の１つとしてビジュアル機能も紹介された。その際、‌ 「高度な音声」モードのスムーズな会話力とともに、ビジュアル機能の実用性と視覚認識の効果が注目を集めたが、同機能の提供は遅れていた。ユーザー待望の機能追加である。

「12 Days of OpenAI」でのデモを紹介すると、ペーパードリップ用のケトルやドリッパーなどをテーブルの上に並べ、それらにカメラを向けてChatGPTにドリップコーヒーの淹れ方を質問した。ChatGPTはユーザーが手順に従っているのを確認しながら、ステップバイステップで淹れ方を説明した。

ビジュアル機能は画面共有もサポートする。「高度な音声」モードで三点ボタンをタップして画面共有を選択すると、スマートフォンの画面に表示されていることについてChatGPTと対話できる。

ビジュアル機能は、ChatGPT EnterpriseとEduのユーザー以外に、約10日をかけてロールアウトする。

サンタ・モードは、クリスマス風にアレンジされたサンタ音声である。ChatGPTの設定の音声選択で「Santa」を選んで「高度な音声」モードを開くと、オーブがスノードームに変化し、「Ho Ho Ho」というサンタの掛け声で音声対話が始まる。サンタ・モードを使用すると、特典として初回時に「高度な音声」の制限がリセットされる。

編集部おすすめ

マイナビニュースの記事をもっと見る

トピックス

自身の進退結論言わない

今日の主要ニュース

国税局で酒の鑑評会

国内の主要ニュース

ロンドンでトランプ氏に抗議

海外の主要ニュース

コラボ実現きっかけ語る

芸能の主要ニュース

私達にふさわしい勝利だと思う

スポーツの主要ニュース

「Logicool G PRO X SUPERLIGHT 2c LIGHTSPEED」発表、若干サイズダウンした小型モデル

トレンドの主要ニュース

□に漢字を入れて4つの熟語を完成させよう

おもしろの主要ニュース

夜景がきれいだと思う「関東地方の三井ガーデンホテル」ランキング！ 2位「三井ガーデンホテル銀座プレミア」、1位は？【2025年調査】

コラムの主要ニュース

ハイスぺ夫と子連れ再婚

特集・インタビューの主要ニュース

ChatGPTの「高度な音声」モードがビジュアル対応、スマホ画面シェアで対話する機能も

トピックス

もっと読む

ITニュースランキング