我正在尝试从头开始为低资源语言编写命名实体识别。首先,我想使用朴素贝叶斯。 我的小谷歌搜索建议我它被广泛用于使用朴素贝叶斯进行文本分类。 它可以用于解决NER问题。任何关于此的建议/方向将不胜感激。我更喜欢Python语言。
欢迎从新语言的起点解决NER问题的其他方法。
答案 0 :(得分:0)
我最近遇到了对命名实体进行分类的相同问题。现在我们可以使用Naive Bayes分类器对命名实体进行分类。帮助我们的是定制功能提取器。
如果您使用的是nltk,请查看此处:http://textblob.readthedocs.org/en/dev/