我知道该模型在配置阶段使用以前训练过的词性标记。但是,如果大多数单词是新的,解析器将如何决定其操作呢?
答案 0 :(得分:1)
我想将@Quantum的答案充实为以下详细内容:
2014年之前,许多解析器都依赖于一组手动设计的功能模板,这些方法有两个缺点:1)他们需要大量的专业知识,通常不完整; 2)大多数运行时都由配置阶段的功能提取部分消耗。 Chen和Mannning发表论文A Fast and Accurate Dependency Parser using Neural Networks之后,几乎所有解析器都依赖于神经网络。
让我们看看Chen和Manning是如何完成这项工作的。
如上图所示,神经网络的输出是softmax函数之后的分布,因此它是一个简单的分类问题,具体取决于某些给定的信息。给定的信息主要包括三部分:堆栈和缓冲区中的前3个字,堆栈中前两个字的两个最左/最右子级,以及最左和最右孙代。以上的POS标签;以及所有子代/孙代的弧形标签。将输入嵌入到一个矩阵中,并通过两个矩阵(如图中的多维数据集函数所示)进行转换,以使其成为logit,然后将三个元素分布在网络顶部。
HTH:)
参考文献:1)A Fast and Accurate Dependency Parser using Neural Networks,2)CMU Neural Nets for NLP 2017 (12): Transition-based Dependency Parsing
答案 1 :(得分:0)
它咨询神谕,以选择任何最可能的过渡 给定点。