标签: python pandas
我有两个单独的文件,一个来自我们的服务提供商,另一个是内部(HR)。
服务提供商以不同的方式写出雇主的姓名,有些人以姓氏姓氏格式写出来,或者姓氏的首字母和姓氏或姓氏在一起写……而HR文件分别包括名和姓。
我的想法是比较列中的两个文件的名字和姓氏,并检索最佳匹配。 我在数据清理中使用Python。