匹配熊猫数据框中的相似单元格

时间:2019-10-23 14:48:16

标签: python pandas matching

问题是我的数据集很大,其中包含有关公司的信息,像这样


          Company Name  Company ID  smth else
1        FALCON LTD EU           2         10
2  FALCON LTD (EUROPE)           1          2
3      MAGIC (EU ZONE)           3          1
4            MAGIC LTD           4          8

您可以看到我们有一些公司的公司名称不同,但公司名称相同,所以问题在于如何将这些公司合并为一个公司并获得类似的权益?

 Company Name  Company ID  smth else
1   FALCON LTD           1         12
2    MAGIC LTD           2          9 

因此,如果他的大部分姓名相似,或者如果一个名字包含另一个名字,则我需要合并公司,我正在寻找某种通用解决方案,因为数据集很大,例如我需要

SUPERNOVA INTERNATIONAL LIMITED = SUPERNOVA INTERNATIONAL LTD = SUPERNOVA INTERNATIONAL LIMITED(欧盟) = SUPERNOVA INTERNATIONAL LIMITED或= SUPERNOVA INTERNATIONAL

但我仍然不知道如何自动执行此操作,而不是手动

0 个答案:

没有答案