标签: classification word2vec word-embedding ner
我正在处理一些拉丁数据,当我使用NER时,使用spacy给出的结果令人满意,但标签错误。我正在尝试提取人员和位置。 我当时正在考虑使用word2vec为文档中的每个单词获取一个向量,然后获取与以前使用NER提取的单词相关联的向量,并使用相似度函数(如果我没记错的话,它是在进行余弦相似度运算)。我对用于对这些实体进行分类的阈值感到困惑。
NER给了我个人,位置以及一些非实体。您如何建议我可以继续?谢谢