标签: spacy
例如,我有一个公司列表,例如: 摩根大通&有限公司 美国银行 国际商业机器公司 东芝公司 等
我会得到我可能不知道的别名。例如IBM,JP,JPMC,BOA或JP Morgan。如何在别名公司列表中获得最佳匹配。例如,如果我在上面的公司列表中做了IBM的相似性,我就会从大型英语模型中获得东芝。同样,将JPMC和摩根大通转换为摩根大通的正确方法是什么?如果首字母缩略词没有嵌入,我该怎么办,例如。 State Street Global Advisors的SSGA。