使用spaCy从运行时提供的实体名称列表中获得可能拼写不同的最佳匹配

时间:2018-04-19 00:02:37

标签: spacy

例如,我有一个公司列表,例如: 摩根大通&有限公司 美国银行 国际商业机器公司 东芝公司 等

我会得到我可能不知道的别名。例如IBM,JP,JPMC,BOA或JP Morgan。如何在别名公司列表中获得最佳匹配。例如,如果我在上面的公司列表中做了IBM的相似性,我就会从大型英语模型中获得东芝。同样,将JPMC和摩根大通转换为摩根大通的正确方法是什么?如果首字母缩略词没有嵌入,我该怎么办,例如。 State Street Global Advisors的SSGA。

0 个答案:

没有答案