斯坦福大学CoreNLP分类器:NER培训环境

时间:2018-06-25 15:45:21

标签: stanford-nlp

在斯坦福大学的CoreNLP分类器中,我看到的所有示例都包含一个人们不想识别的单词(用O表示)。例如,“确定”以下和“之前”以下不被识别为资产:

certain O       O
Apple   ASSET   ASSET
products       ASSET   ASSET
macOS   ASSET   ASSET
before  O       O

1)我需要提供“确定”和“之前”等上下文的单词吗?

2)订单重要吗?我可以而不是“一定要在某些苹果,macOS产品之前”执行命令吗?

3)如果需要上下文,一旦添加了足够的培训数据,是否可以在没有上下文的情况下添加更多资产?

1 个答案:

答案 0 :(得分:1)

广告1。如果您的分类依赖于上下文,则上下文会有所帮助。

广告2.斯坦福大学CoreNLP分类器使用CRF(Conditional Random Field)算法,该算法也使用单词顺序正确分类。

广告3。请参阅pt。 1.-必要性取决于您的问题和数据。您可以重用以前的上下文,看看是否可以提高或降低分类的准确性。