
またも「スパム」扱いされて、ガッカリ……。怪しい者ではないんですよ(たぶん)。
PCで「メールを出したのに相手に届かない」「メールをもらったのにこちらに届かない」「戻ってもこない」ということが、けっこうある。
そんなことを人に話すと、「添付ファイルがあると、スパム扱いされやすい」とか、「ホットメールはスパム扱いされやすい」「初めてのアドレスだとスパム扱いになるのかも」なんてことを言われるけど、添付ファイルもなく、ホットメールでもなく、やりとりが今まであった人なのに、行方不明になってしまうのって、いったいどういう理由なんでしょう?
先日も、IT系の雑誌編集者の友人にメールをしたところ、「スパム扱いではじかれていた」という知らせをもらい、その理由を聞いてみると、こんな説明があった。
「経験上、ホットメールは誤認識されやすいんですが、○○(私の使っているメールソフト)を騙って不正行為を働くケースも多いので、誤認識されやすいのかもしれません」
メールソフトのせいか……と落胆していると、さらに、こんな説明が続いた。
「私のところでは『スパム判定の閾値』を13にしていて、アナタのメールは15.3でした。50とかいっちゃうメールも珍しくないので、まあ、この数値なら『紙一重で誤判定』と言って良いでしょう。最もデカい要因は『7.5 BAYES_99』で、『文面がスパムっぽい』と判断されているということですね」
????? 何のことやらさっぱりわかりません……。「スパムっぽい文面」とはいったい?
「ベイジアンフィルタといって、コンピュータの偉い人(ポール・グラハム氏)が2002年に『A Plan for Spam』という論文を発表して以来、相当な数のメールサーバ、メールソフトで採用されている手法です。すごく単純化してしまえば、メールの内容をチェックして、統計学的手法でスパムらしき相関性のある単語の使われ方が見られたら、スパム判定する、というロジックのようです。で、『スパムメール』と『そうでないメール』をプログラムに教え込むことによって、判定精度が上がっていく、という仕掛けです。育てゲーのようでなかなか楽しいですよ」
ところで、「統計的にスパムっぽい関連性のある単語の使われ方を見つけ、スパム判定することを教え込ませている仕掛け」のなかで、私の文面の何が「スパム」っぽいと判断されたのでしょうか。
「アナタのメールは『!』が多かったり、タイトルが短かったりして、いわゆる『エロスパムメール』『もうかりまっせスパム』に文体がちょっと似ている気がしないでもないので、そういうことも影響しているかもしれません」
自分のメールは、淡々として冷たい印象を与えることが多いらしいので、友人には、少しは可愛げがあるようにお愛嬌として「!」などを入れていたのに……ずいぶんショックです……。
ちなみに、HTML形式のメールとか、件名がないとか、「お世話になります」「こんにちは」なども、スパム扱いされがちとよく聞くけど……。
思い当たる人は、件名や文体などに、ちょっと注意してみたほうが良いかもしれません。
(田幸和歌子)
そんなことを人に話すと、「添付ファイルがあると、スパム扱いされやすい」とか、「ホットメールはスパム扱いされやすい」「初めてのアドレスだとスパム扱いになるのかも」なんてことを言われるけど、添付ファイルもなく、ホットメールでもなく、やりとりが今まであった人なのに、行方不明になってしまうのって、いったいどういう理由なんでしょう?
先日も、IT系の雑誌編集者の友人にメールをしたところ、「スパム扱いではじかれていた」という知らせをもらい、その理由を聞いてみると、こんな説明があった。
「経験上、ホットメールは誤認識されやすいんですが、○○(私の使っているメールソフト)を騙って不正行為を働くケースも多いので、誤認識されやすいのかもしれません」
メールソフトのせいか……と落胆していると、さらに、こんな説明が続いた。
「私のところでは『スパム判定の閾値』を13にしていて、アナタのメールは15.3でした。50とかいっちゃうメールも珍しくないので、まあ、この数値なら『紙一重で誤判定』と言って良いでしょう。最もデカい要因は『7.5 BAYES_99』で、『文面がスパムっぽい』と判断されているということですね」
????? 何のことやらさっぱりわかりません……。「スパムっぽい文面」とはいったい?
「ベイジアンフィルタといって、コンピュータの偉い人(ポール・グラハム氏)が2002年に『A Plan for Spam』という論文を発表して以来、相当な数のメールサーバ、メールソフトで採用されている手法です。すごく単純化してしまえば、メールの内容をチェックして、統計学的手法でスパムらしき相関性のある単語の使われ方が見られたら、スパム判定する、というロジックのようです。で、『スパムメール』と『そうでないメール』をプログラムに教え込むことによって、判定精度が上がっていく、という仕掛けです。育てゲーのようでなかなか楽しいですよ」
ところで、「統計的にスパムっぽい関連性のある単語の使われ方を見つけ、スパム判定することを教え込ませている仕掛け」のなかで、私の文面の何が「スパム」っぽいと判断されたのでしょうか。
「アナタのメールは『!』が多かったり、タイトルが短かったりして、いわゆる『エロスパムメール』『もうかりまっせスパム』に文体がちょっと似ている気がしないでもないので、そういうことも影響しているかもしれません」
自分のメールは、淡々として冷たい印象を与えることが多いらしいので、友人には、少しは可愛げがあるようにお愛嬌として「!」などを入れていたのに……ずいぶんショックです……。
ちなみに、HTML形式のメールとか、件名がないとか、「お世話になります」「こんにちは」なども、スパム扱いされがちとよく聞くけど……。
思い当たる人は、件名や文体などに、ちょっと注意してみたほうが良いかもしれません。
(田幸和歌子)
編集部おすすめ