サイト内検索:
Loading

さくらのレンタルサーバーの迷惑メールフィルタの重み

| コメント(0) | トラックバック(0)

以前,さくらのレンタルサーバーの迷惑メールフィルタの設定について書いた(参考1).このフィルタはメールのヘッダと本文を解析し,

スコア = [ヘッダの解析によるスコア] + [本文の解析によるスコア],

を各メールについて算出し,そのスコアが閾値以上であったら迷惑メールと判定する.

本文の解析では,あらかじめ学習させておいた通常メールと迷惑メールのデータベースを参照し,ベイズの定理に基づいて対象メールが迷惑メールである確率を算出し,その確率に応じてスコアを決定する.

デフォルトの設定では本文の解析によるスコアが低めに設定されているが,自分の下へ届いた相当数のメールをあらかじめ学習させておけば,本文の解析によるスコアの精度は非常に高いはずである.

そこで,本文の解析によるスコアを積極的に利用するよう設定を変更した.

迷惑メールであるという閾値を 5.0 とした上で,user_prefsファイルに(参考1)下記のように追記した.

[ /home/USERNAME/.spamassassin/user_prefs ]
score BAYES_99 8.0
score BAYES_95 5.0
score BAYES_80 3.0
score BAYES_60 2.0
score BAYES_50 1.0
score BAYES_40 0.5
score BAYES_20 -0.5
score BAYES_05 -2.0
score BAYES_00 -5.0

ここでUSERNAMEはサーバーのログイン名である.

上述の設定は,迷惑メールである確率に応じたスコアの対照表を表している.例えば,ベイズの定理に基づいて 99 %以上の確率で迷惑メールと判定された場合は,本文の解析によるスコアとして 8.0 が与えることを意味する.95 %以上の判定では 5.0 以上のスコアが与えられて基本的に迷惑メールの判定となる.

一方で,0%の判定だと負のスコアが与えられ,ヘッダの情報が多少怪しくても通常メールとして認識される.

私の場合は,この設定に変えてから迷惑メールが激減した.この設定の妥当性は,学習させたメールの精度や,各ユーザーのポリシーに依ると思うので,参考までに.

参考:

  1. http://www.web-cahier.com/log/2010/12/post-37.html
Add to Google

トラックバック(0)

トラックバックURL: http://www.web-cahier.com/mt-5.01/mt-tb.cgi/92

コメントする