我很想知道更多关于斯坦福解析器用来处理看不见的单词的启发式/技巧。
例如,给定输入:aa aaa aaaa, "bb bbb bbbb"?
,解析器生成:(ROOT (SQ (VP (VB aa) (NP (NP (NN aaa) (NN aaaa)) (, ,) (
。另一个例子,给定:) (NP (NN bb) (NN bbb) (NN bbbb)) ('' ''))) (. ?)))
,解析器输出为:
aaa aaaa
。解析器如何解析这些句子?
我查看了Stanford Parser FAQs页面以及解析器邮件列表,但未找到有关此主题的任何讨论。
提前感谢任何见解。