Learnig NER使用类别列表

时间:2017-04-22 15:06:11

标签: machine-learning nlp named-entity-recognition crf crf++

在CRF ++培训模板中,如何为上市公司提供自定义dictionary.txt文件,为欧洲大陆食品提供另一种文件,例如,或几乎任何类别。

然后提供每个类别的样本培训数据,从而了解如何在该类别的上下文中使用这些特定命名的entites。
通过这种方式,我和系统一样,可以确定它是否正确理解某些命名的entites如何在文本中构建,无论是推文还是普利策奖获奖新闻文章,而不是提供数百兆字节的数据。

这会很酷。模型将有一个明确的已知词典(不需要扩展),以及关于如何在人类文本中构建这些已知词条的统计方法。

PS - 为了清晰起见,不要向往正则表达式。如果你在字典中有很多,很多规则和大量的枯燥时间,这些只是很酷。

0 个答案:

没有答案