在线网址分类器

时间:2009-12-10 15:34:50

标签: url dns classification

我想写一个在线应用程序:

  1. 从浏览器的地址栏中读取网址
  2. 提取其词汇特征(如n-gram)
  3. 提取其基于主机的功能(在线提取DNS记录,其A,PTR,TTL字段)
  4. 将网址分类为恶意或良性(使用机器学习)
  5. 任何人都可以帮我1和3吗?

2 个答案:

答案 0 :(得分:0)

我不相信这(应用程序)是您可以完成的任务,因为您无法根据网址真正确定网站内容。

请参阅Mozilla Phishing Protection Design DocumentationGoogle Safe Browsing spec之类的内容

答案 1 :(得分:0)

不知道你在看什么语言。

对于第1项,这里有一个可能有用的.net库

http://msdn.microsoft.com/en-us/library/system.web.httputility.aspx