检测邮件地址相似性

时间:2011-07-24 15:37:00

标签: mysql ruby-on-rails ruby sphinx thinking-sphinx

我们在尝试注册多个帐户以利用推荐奖励和免费试用奖励时遇到问题。我们需要一个邮寄地址并对USPS进行验证,但发现它仍然没有提供足够的保护,用户仍然很容易更改地址上的元素,如“第2行”,并且仍然有效。< / p>

检测其他用户是否已注册地址的最佳途径是什么?

地址变化示例:

59 Grant Ave. 2楼

59 Grant Ave. 2号套房

任何类似于精确比较的问题都是街道地址可能在不同的公寓/办公室等处有多个租户。

我们正在使用Rails 3,MySQL,Memcache,Sphinx

2 个答案:

答案 0 :(得分:1)

我们面临着类似的问题,尽管在不同的背景下。你可以做的不多,我们基本上写了一个方法,试图根据标准化的电话号码,标准化的街道地址,Leveshtein distance的名称和地址,地理编码地址时的物理距离等来识别可能的重复项。如果某些东西确实是重复的,那么仍然需要一个人,但至少你可以显着减少可能的候选人数。

答案 1 :(得分:0)

要求智能可靠地执行,因此您可以忘记算法。我认为你能做的最好的事情就是报告与已提交的地址类似的地址,然后交由一个人来决定。