如何以编程方式,可靠地确定电子邮件地址是否来自大学?

时间:2012-11-09 22:42:08

标签: email email-validation

为了提供学生和教师的折扣,我如何以编程方式验证电子邮件地址是否归大学所有?

我会使用$email =~ /\.edu$/,但非美国大学不会将自己限制在.edu个域名。

E.g。 mail@cs.zu.de

我会执行SPARQL查询,将电子邮件地址预处理到其超级域(zu.de,然后搜索主页(University)超域({{1}的web.zu.de个对象}})匹配电子邮件地址超级域,但是......

维基百科/ dbpedia没有针对每所大学的文章,有时不那么受欢迎的大学在一篇文章中组合在一起。

所以我选择维护自己的大学电子邮件地址数据库(yuck),或者确定某种类型的开放式数据库。有没有?

1 个答案:

答案 0 :(得分:2)

如果您没有找到可靠的大学域名列表,您可以适度考虑:保留您自己的大学域名数据库,仅在您收到无法识别的域名时,将其标记为待审核,让真人验证域名是否属于大学,然后将其作为属于大学的数据库添加到您的数据库中。然后,您可以使用已知大学预先填充数据库(根据您对预期用户群的期望),并将主要免费电子邮件提供商列入黑名单(即标记为非大学),这样您就不必逐个验证它们

这种方法的另一个好处是,您最终会得到一个过滤的大学相关电子邮件域数据库,这将是一个有用的资源,您可以将其作为服务提供。