为了提供学生和教师的折扣,我如何以编程方式验证电子邮件地址是否归大学所有?
我会使用$email =~ /\.edu$/
,但非美国大学不会将自己限制在.edu
个域名。
E.g。 mail@cs.zu.de
。
我会执行SPARQL查询,将电子邮件地址预处理到其超级域(zu.de
,然后搜索主页(University
)超域({{1}的web.zu.de
个对象}})匹配电子邮件地址超级域,但是......
维基百科/ dbpedia没有针对每所大学的文章,有时不那么受欢迎的大学在一篇文章中组合在一起。
所以我选择维护自己的大学电子邮件地址数据库(yuck),或者确定某种类型的开放式数据库。有没有?
答案 0 :(得分:2)
如果您没有找到可靠的大学域名列表,您可以适度考虑:保留您自己的大学域名数据库,仅在您收到无法识别的域名时,将其标记为待审核,让真人验证域名是否属于大学,然后将其作为属于大学的数据库添加到您的数据库中。然后,您可以使用已知大学预先填充数据库(根据您对预期用户群的期望),并将主要免费电子邮件提供商列入黑名单(即标记为非大学),这样您就不必逐个验证它们
这种方法的另一个好处是,您最终会得到一个过滤的大学相关电子邮件域数据库,这将是一个有用的资源,您可以将其作为服务提供。