存储街道地址&防止重复

时间:2010-11-14 06:25:29

标签: database web

我有一个数据库,我通过Django& amp;蟒蛇。我们希望根据地址存储建筑物(不是名称,因为有些建筑物根本没有名称)。

我们需要阻止用户在同一建筑物的数据库中输入重复的条目。通过人们输入地址的方式使这变得困难(例如“1000 Main Street”与“1000 Main St。”)

我们以何种方式可靠地防止重复?我正在使用MySQL数据库。

由于

2 个答案:

答案 0 :(得分:0)

如果您只与美国合作,可以使用USPS地址标准化网络服务来解决重复项:

http://www.usps.com/webtools/address.htm

答案 1 :(得分:0)

地址重复数据删除是一项复杂的任务。虽然USPS网络服务没有问题,但它在一些重要功能方面严重缺乏。另外,使用常规Web服务执行批量重复数据删除,执行请求等效率非常低。

而且,似乎USPS已经更新了他们的网站,所以Dan发布的链接虽然有用但现在已经破了。

作为更新的答案,我想指出我为SmartyStreets工作,我们从地址列表中删除重复项。例如,您可以将列表上传到CASS-Certified Scrubbing,并且地址将被标准化并标记为重复。这种方式很容易 。如果您需要入口点验证,请查看LiveAddress,它提供的信息比仅USPS服务更重要。