大規模言語モデル(Large Language Model、LLM)による自動応答では、情報漏えいリスクを抑えるために、プライバシー保護の強度を定量化する指標である差分プライバシーに基づいてノイズを加える方法が注目されているが、その影響で応答精度が下がる課題があった。
同社では、ノイズが応答精度に与える影響を理論的に分析し、その知見に基づき、差分プライバシーを維持しつつ応答傾向の推定精度を向上させる新たな入力と応答のペアの生成手法としてPlausible Token Amplification(PTA)を提案、重要な単語に注目させることで精度と安全性の両立を可能にする仕組みを実現している。
NTTでは本成果について、医療・行政・金融などの利用者に関わるデータの扱いに安全性と実用性の両立が求められる分野で、将来的なリスクに備えたLLM活用が期待されるとしている。
同成果は、7月13日から19日までカナダで開催される機械学習分野における難関国際会議International Conference on Machine Learning(ICML)2025で発表される。