在数据框中保持最佳输入

时间:2018-10-08 13:40:10

标签: python dataframe

假设我具有以下数据框:

    DeedNo  Partner1    Partner2
0   4       Ysolda      Calcerani
2   4       Calcerani   
3   4                   Ysolda
4   4       Calcerano   Ysolda
5   4       Calceranus  Ysolde
6   10      Catherina
7   10      Lencium     
8   10      Lencij  
9   18      Catherina   Frankynj
10  18                  Frankyni Vassaldo

有没有办法保持每张契约的最佳入账,即:对于契约4,最好的入账可以是(Ysolda,Calcerani),(Calcerano,Ysolda)或(Calceranus,Ysolde)

对于契约10(Catherina)和(Lencium或Lenciy)最好,而对于契约18(Catherina,Frankynj)则最好。

我正在尝试从文本中结婚,但是正如您所看到的,有一些名称变体,尽管存在用于关系的关键字,但有时可能只能获得其中一个伴侣。谢谢

0 个答案:

没有答案