在斯坦福大学的CoreNLP分类器中,我看到的所有示例都包含一个人们不想识别的单词(用O表示)。例如,“确定”以下和“之前”以下不被识别为资产:
certain O O
Apple ASSET ASSET
products ASSET ASSET
macOS ASSET ASSET
before O O
1)我需要提供“确定”和“之前”等上下文的单词吗?
2)订单重要吗?我可以而不是“一定要在某些苹果,macOS产品之前”执行命令吗?
3)如果需要上下文,一旦添加了足够的培训数据,是否可以在没有上下文的情况下添加更多资产?
答案 0 :(得分:1)
广告1。如果您的分类依赖于上下文,则上下文会有所帮助。
广告2.斯坦福大学CoreNLP分类器使用CRF(Conditional Random Field)算法,该算法也使用单词顺序正确分类。
广告3。请参阅pt。 1.-必要性取决于您的问题和数据。您可以重用以前的上下文,看看是否可以提高或降低分类的准确性。