ChatGPTでは、12年間にわたる大量のWebクロールデータや英語版Wikipediaなどペタバイト級の情報、ChatGPTユーザーが入力した文章を学習していると言われ、過去に誤って公開された機微情報を含むWebページやユーザーが誤入力した社外秘や個人情報などを学習している可能性がある。また、OSSの開発者や研究者などは、GitHubなどの公開リポジトリや研究組織のWebページ上でメールアドレスを公開する傾向があり、ChatGPTがこれらの個人情報を学習している可能性がある。
同ブログでは、ChatGPTなどの生成AIが学習した情報が第三者に開示され得るのか確認するとともに、想定される対策を解説している。
同ブログでは、個人情報の開示を意図したプロンプトを拒否するフィルター「Guardrail」を回避し、ChatGPTで他者のメールアドレスを開示させることができるか、既知のメジャーなJailbreak手法と応答精度を高めるCoT(Chain of Thought)を組み合わせることで実現している。また、ChatGPT以外の生成AIでも同様に個人情報を開示できるか検証を行っている。
さらに同ブログでは、ChatGPTなど生成AIによる個人情報開示の対策例を、下記の2つの視点で解説している。
・生成AIを利用するユーザーの視点
プロンプトに個人情報や機密情報を入力しない
「会話を学習させない」モードを有効にする
プライバシーに配慮したサービスを利用する
・生成AIを活用してサービス提供する企業・行政などの視点
ユーザーの入力を学習させないようにする
Prompt Injectionを検知する
不正なプロンプトを拒否する
検閲用のAIを使用する











![[USBで録画や再生可能]Tinguポータブルテレビ テレビ小型 14.1インチ 高齢者向け 病院使用可能 大画面 大音量 簡単操作 車中泊 車載用バッグ付き 良い画質 HDMI端子搭載 録画機能 YouTube視聴可能 モバイルバッテリーに対応 AC電源・車載電源に対応 スタンド/吊り下げ/車載の3種類設置 リモコン付き 遠距離操作可能 タイムシフト機能付き 底部ボタン 軽量 (14.1インチ)](https://m.media-amazon.com/images/I/51-Yonm5vZL._SL500_.jpg)