标签: google-api fuzzy-search
我有很多机构名称(约17,000),其中包含很多错误,我必须清理它,即使使用正则表达式和levenstein距离方法,但它仍然是很多我想避免的手工作业!我可以在此列表中使用 Google的搜索,并创建一个与机构名称最接近的新列表吗?
我想在谷歌搜索每个机构名称,然后希望该程序/ API返回最接近的匹配,我想要做17k名称,那么我该如何实现自动化呢?
如果可能,请提供详细的解决方案。