很久以前,我按照http://wiki.apache.org/spamassassin/SiteWideBayesSetup实施了网站范围的贝叶斯过滤。
我认为它不起作用,我当然发现我的垃圾邮件分数总是负数,BAYES_00
表明贝叶斯根本没用过。
以下是我在local.cf
文件中的内容:
bayes_path /etc/mail/spamassassin/bayes/bayes
bayes_file_mode 0777
当我运行sa-learn
时,我发现令牌存储在各个主目录中。
使这项工作的正确方法是什么?
补充问题:如果我可以使用它,我可以合并各种bayes_tok
和其他文件吗?
答案 0 :(得分:2)
如果你得到BAYES_00
结果,那么贝叶斯确实在工作,因为它已将电子邮件归类为火腿。中立的结果是BAYES_50
。您只需要正确训练贝叶斯数据库。
如果sa-learn
在您的主目录下创建/更新了bayes文件,那么它要么没有读取所需的local.cf
文件,要么被bayes_path
被用户特定的配置文件覆盖(例如/root/.spamassassin/user_config
)。
您可以尝试以下方法之一:
sa-learn
指定sa-learn的显式路径,即
sa-learn --dbpath /etc/mail/spamassassin/bayes/bayes
使用-D
选项查看实际情况,即正在读取的配置文件等。
如果/当你开始工作时,你通常可以不组合各种数据库文件。至少有一个bayes_toks
和一个bayes_seen
文件,因为其中一个包含已学习的令牌,另一个包含电子邮件Message-Id:s和相关的培训状态(垃圾邮件/火腿)。如果您使用延迟同步,则可以选择bayes_journal
。
sa-learn的联机帮助页面中提供了更多详细信息:
https://spamassassin.apache.org/full/3.4.x/doc/sa-learn.html