我是自然语言处理的初学者,我正在阅读 POS标记和成分。我遇到了一个句子的组成部分是正确但条件标签错误的条件。
我使用了Stanford Parser。 http://nlp.stanford.edu:8080/parser/index.jsp
例如,“女士,我是亚当”将Madam称为Adverb,这是不对的,但成分是正确的。
我正在寻找一个句子,其中POS标签是正确的,但成分是错误的。 任何句子都可以满足上述条件吗?
答案 0 :(得分:4)
是。可能有POS标签正确和错误的组成结构。
例句 - 他们在草地上玩耍。
POS标记和成分是,
(ROOT
(S
(NP (PRP They))
(VP (VBD played)
(PP (IN in)
(NP (DT the) (NN ground)))
(PP (IN with)
(NP (NN grass) (NN turf))))))
这意味着,'他们在地上玩耍(草坪草的帮助/使用)。 但原始的组成结构应该是,
(ROOT
(S
(NP (PRP They))
(VP (VBD played)
(PP (IN in)
(NP (DT the) (NN ground))
(PP (IN with)
(NP (NN grass) (NN turf)))))))
理想情况下,“他们在地上玩耍有草皮”。
在第一句成分中,草皮有资格“他们玩”而在第二个成分中,草皮符合地面,这是语义上的恰当含义。
由于没有逗号,这句话有点含糊不清。但它在语法和语义上都是正确的。
答案 1 :(得分:2)
由于将给定字符串划分为越来越小的子字符串有不同的方法,因此给定字符串的正确POS标记可能被分配不正确的组成结构也就不足为奇了。
@Sherlocked给出的例子是一个句法歧义的例子,其中一个含义比其他含义更好。另一种情况是(1)中句子中的名词短语咨询委员会成员。
(1)咨询委员会成员被要求不与新闻界谈话
关于所讨论的名词短语的最自然的解释,形容词 advisory 修饰名词委员会,这意味着咨询的结构>和委员会形成一个组成部分优于委员会和成员组成的结构。 (委员会和成员应构成组成部分的一个例子是名词短语疲惫的委员会成员。)
要给出一个案例的许多可能例子中的一个,你要问的不涉及句法歧义,请考虑(2)中的句子。
(2)他们希望他读这本书
根据转换语法理论,(2)中的他应该是嵌入式无限条款的一部分,而不是动词想要的直接对象;假设这一点的一个原因是(2)中的他从动词 read 中获得主题角色。可以想象,解析器会将正确的POS分配给(2)中的单词,但会分配(2)不正确的结构,其中他是想要的的直接对象。增加出现这种错误的可能性的一个因素是,如果我们在(2)中替换想要的,例如告诉,那么正确的结构就是他是告诉的直接对象,因为在他们告诉他阅读这本书,他从获得了一个主题角色>告诉