模糊字符串匹配

时间:2017-06-12 13:44:14

标签: google-api fuzzy-search

我有很多机构名称(约17,000),其中包含很多错误,我必须清理它,即使使用正则表达式和levenstein距离方法,但它仍然是很多我想避免的手工作业!我可以在此列表中使用 Google的搜索,并创建一个与机构名称最接近的新列表吗?

我想在谷歌搜索每个机构名称,然后希望该程序/ API返回最接近的匹配,我想要做17k名称,那么我该如何实现自动化呢?

如果可能,请提供详细的解决方案。

0 个答案:

没有答案