确定电子邮件地址是邮件列表地址还是个人电子邮件地址

时间:2017-03-03 07:09:19

标签: machine-learning dataset data-mining

现在我正在构建一项功能,以确定电子邮件地址是邮件列表地址/群组邮件地址还是个人电子邮件地址。我目前的策略是使用人工手动注释,然后这些数据用于确定传入的邮件地址。示例recruitment@stackoverflow.com是邮寄地址,因此我存储此电子邮件地址recruitment的名称并标记为组,因此将来如果收到名称为recruitment的电子邮件,我会忽略它。在没有使用使用手动注释构建的数据集的情况下,您是否有任何其他解决方案来构建此功能?任何帮助将不胜感激

1 个答案:

答案 0 :(得分:0)

将域名地址用作功能或两个名称都可能是有意义的。毕竟很多邮件列表都是公司的,许多个人地址来自雅虎,Gmail等网站。具有附加功能可以为您提供更多数据,用于创建学习算法来对邮件进行分类,例如Perceptron( https://en.wikipedia.org/wiki/Perceptron)。这种方法仍然需要手动更新,但它可以使您的功能随着时间的推移变得更加智能。