我的公司名称如下:
1.Apple Inc. 2.Apple computers Inc. 3.Apple 4.IBM 5.国际商业机器 国际商业机器公司 5.国际商业机器公司 6.Ibm corp ..
我需要将文本与正确的公司名称相匹配,并用正确的公司名称替换所有其他类似物......有什么办法吗?
答案 0 :(得分:0)
maybe this might help?这是一个python差异库。
你可以计算每个字符串之间的差异,如果两个字符串非常相似,那么你可能(可能注意到)假设由于它们有很多共同之处,它们可能是同一个公司。
答案 1 :(得分:0)
有python library名称匹配。
> choices = ["Atlanta Falcons", "New York Jets", "New York Giants", "Dallas Cowboys"]
> process.extract("new york jets", choices, limit=2)
[('New York Jets', 100), ('New York Giants', 78)]
> process.extractOne("cowboys", choices)
("Dallas Cowboys", 90)