問題が発覚したのは、同院の中国語知識・情報処理グループが開発を進めている「CKIP-Llama-2-7b」。同院によると同言語モデルは、米IT大手メタが開発した「Llama2」により高度な繁体字中国語の処理能力を備えさせることを研究目標の一つとする。ベータ版が一般に向けて公開されていた。
一般の使用者が同言語モデルに「あなたを作ったのは誰」との問いを入力したところ、中国の大学や研究機関の名称を返答したり、「私の国のリーダー」との質問には「習近平」と答えたりすることが分かり、問題視する声が上がっていた。
同言語モデルの開発を担当する研究員は同院を通じ、生成AIはハルシネーション(幻覚、もっともらしいうそ)を生み出しやすいものだと説明し、今回指摘されたような内容を同言語モデルが生成することは予期していなかったと述べた。
(張雄風/編集:田中宏樹)