使用模型比较名称和姓氏

时间:2018-04-11 06:58:07

标签: machine-learning gensim

我将员工姓名保存在文本文件中。我处理了文件并比较了一个已存在的名称。 当我使用most_similar方法检查时,我发现它返回完全不相关的名称,即使语料库中存在完全相同的名称。

export class DetailUserComponent implements OnInit {

    detailPerson: Person;
    People:Person[];
    @Input() id;
    that;

    constructor(
        private route: ActivatedRoute,
        private conexion: ConexionPersonService) { }

    ngOnInit() {
        this.id = +this.route.snapshot.paramMap.get('id');
        this.conexion.getPeople();
        this.getPerson();
    }


    getPerson(): void {

        this.detailPerson = this.conexion.getPerson(this.id);   

     }

如何正确训练数据以返回(密切)匹配的名称?

1 个答案:

答案 0 :(得分:2)

您可以根据编辑距离来定义相似度,即两个字符串的相似程度。

x2vec模型根据语义接近度定义相似性,即通过机器学习和共现统计计算两个含义的相似程度。

换句话说,你正在用大锤杀死一只苍蝇。请转而查看tools for computing string distance

from Levenshtein import distance
string1 = 'aakash'
string2 = 'akash'
string3 = 'konstantinos'
print(distance(string1, string2))
1
print(distance(string1, string3))
11