标签: algorithm string-comparison
我正在从不同来源导入数据,需要将此数据中的公司名称与已定义和已清理公司的列表进行比较,我在数据库中的内容。
问题是,我以不同的方式成为公司,而且有些不同的写作方法。例如,我的数据库中有“Google GbmH”公司。但我从我的来源名称变成了以下形式:Google,Google Germany GmbH,Google Germany等。
我需要一个算法,可以比较这些字符串并检测,这是我的数据库“Google GmbH”中的公司。
最好的方法是什么?