Question

在斯坦福大学的CoreNLP分类器中，我看到的所有示例都包含一个人们不想识别的单词（用O表示）。例如，“确定”以下和“之前”以下不被识别为资产：

certain O       O
Apple   ASSET   ASSET
products       ASSET   ASSET
macOS   ASSET   ASSET
before  O       O

1）我需要提供“确定”和“之前”等上下文的单词吗？

2）订单重要吗？我可以而不是“一定要在某些苹果，macOS产品之前”执行命令吗？

3）如果需要上下文，一旦添加了足够的培训数据，是否可以在没有上下文的情况下添加更多资产？

Answer 1

广告1。如果您的分类依赖于上下文，则上下文会有所帮助。

广告2.斯坦福大学CoreNLP分类器使用CRF（Conditional Random Field）算法，该算法也使用单词顺序正确分类。

广告3。请参阅pt。 1.-必要性取决于您的问题和数据。您可以重用以前的上下文，看看是否可以提高或降低分类的准确性。