我计划实施一项服务来测试现代电子邮件客户端的垃圾邮件检测功能,以及gmail,hotmail等网络邮件服务......
该项目处于非常早期的状态,我实际上只是想出哪种技术可能是最好的,或者找到一种方法来做到这一点。
我的实际计划是:设置本地邮件服务器,接收一捆垃圾邮件。它使用原始标题转发邮件(因此接收方认为邮件是直接发送的)到各个平台上的帐户。我打算下载未检测到的邮件来计算检测结果。
问题可能是,我的IP(发送smtp服务器)将在短时间内出现在大多数黑名单上。有没有人建议绕过这个问题?
请不要讨论我将如何获得垃圾邮件,或者我将如何提取结果。这个帖子应该只是关于发送电子邮件。
请不要将我视为垃圾邮件发送者,当然不会滥用该系统。这仅用于研究目的!
感谢您的建议!
答案 0 :(得分:1)
除非:
,否则不可能避免被列入黑名单如果避免黑名单很容易,那么所有垃圾邮件发送者都会这样做:) 我在mail filtering solution工作。为了促进它,开发了a web site评估任何邮件服务器的安全性。测量垃圾邮件过滤器的效率被考虑,但最终放弃了。原因可能对您有用:
定义什么是垃圾邮件并不容易:邮件列表对用户可能是合法的,而对另一个邮件列表则是垃圾邮件。因此,衡量捕获率并不像人们想象的那么简单。
今天的大多数过滤都基于发件人IP信誉:我们客户的邮件过滤器平均被阻止了所有传入SMTP连接的70%(并且高达90%!)。仅基于内容分析的垃圾邮件过滤器有效性的度量将不具有代表性。
我们参加了由VirusBulletin举办的垃圾邮件过滤器竞赛。为了模拟连接级别过滤,VirusBulletin在其测试电子邮件中添加了一个自定义标头,提供了原始发件人IP地址,我们调整了垃圾邮件过滤器,将此标头用作真正的发件人IP地址。
另一方面,随着IPv6(最终)的到来,IP黑名单将很难收集所有垃圾邮件地址(想想僵尸网络)和content analysis may become critical again。
连接级别限制阻止快速发送许多测试电子邮件以防止DDOS攻击,大多数邮件服务器会降低连接速率,这样您就无法每秒打开太多连接,或每个连接发送太多邮件。你将无法快速发送一堆垃圾邮件。
现代垃圾邮件过滤器会根据收件人行为进行调整:,例如,如果您向john@doe.com发送邮件,则来自john@doe.com的所有未来邮件都可能会列入白名单(除非有害)。但来自不同发件人的相同邮件可能会被阻止为垃圾邮件。因此,要评估垃圾邮件过滤器的效率,您需要准确了解收件人测试地址的保护方式,并最终禁用某些过滤功能。另一个例子是语言过滤,其中垃圾邮件过滤器阻止所有不在收件人语言中的邮件。
我希望这会有所帮助!