我看过Stanford NER和Polyglot。两者都不支持泰米尔语。 我想使用ML和一些基于规则的NLP处理来进行实体识别
答案 0 :(得分:1)
Stanford NER和Polyglot都不是基于规则的。如果您只考虑基于规则的系统,您应该寻找能够正确处理泰米尔语的现有框架,或者寻找通用框架(例如GATE)。
查看报告泰米尔语现有NER系统的this paper,您可以联系作者。
如果您找不到可用的系统,使用现有数据集(例如NER-FIRE2013和NER-FIRE2014训练一个系统应该相当容易:向组织者询问如何获取对这些数据集的访问权限。< / p>
希望这有帮助!