我对英语PCFG模型和Penn树库注释的目的感到困惑,Standford Parser的包只包含了所有类型的模型,如果我们已经有来自Peen treebank的注释,它总是质疑这个模型是如何工作的。简单来说,Peen Treebank Annaotation对Parser的作用是什么?Model如何出现?如果原始文本来自解析器,是否需要查询Treebank来预测树木?
我正在阅读一些材料,但仍然不知道Model何时在以下步骤生成。 1,选择一个可用的树库。 2,选择适合树库注释的解析器引擎。 3,选择培训和测试数据。 4,在训练集上训练解析器。 5,评估解析器在测试集上的准确性。 6,用实验结果撰写项目报告。
任何人都可以提供帮助吗?
答案 0 :(得分:1)
它是在步骤4之后保存的状态,您可以使用它来评估解析器或在以后解析文本,而无需重新训练。