我正在尝试消除名称歧义,到目前为止,我尝试使用名称的缩写来获得部分匹配。我想知道是否可以使用任何机器学习技术来比较我的结果。我发现了很多有关作者姓名歧义消除的信息,但是其中大多数是受监督的方法。 这是我的数据示例:
Names
0 Michaele Frendu
1 Lucam Zamit
2 Johanne Luckys
3 Albano Fava
4 Augustino Bagliu
5 Lucas Zamit
6 Micheli Frendu
7 Luce
8 Far
9 Petro Calleya
10 Petrj
11 Marie
12 Michaele
13 Bartholomeus Gaudixj
14 Matheus de Vassaldo
15 Johannes Zurki
16 Michael