公司名称的文本匹配

时间:2013-07-07 05:13:22

标签: text match

我的公司名称如下:

1.Apple Inc. 2.Apple computers Inc. 3.Apple 4.IBM 5.国际商业机器 国际商业机器公司 5.国际商业机器公司 6.Ibm corp ..

我需要将文本与正确的公司名称相匹配,并用正确的公司名称替换​​所有其他类似物......有什么办法吗?

2 个答案:

答案 0 :(得分:0)

maybe this might help?这是一个python差异库。

你可以计算每个字符串之间的差异,如果两个字符串非常相似,那么你可能(可能注意到)假设由于它们有很多共同之处,它们可能是同一个公司。

答案 1 :(得分:0)

python library名称匹配。

> choices = ["Atlanta Falcons", "New York Jets", "New York Giants", "Dallas Cowboys"]
> process.extract("new york jets", choices, limit=2)
  [('New York Jets', 100), ('New York Giants', 78)]
> process.extractOne("cowboys", choices)
  ("Dallas Cowboys", 90)