使用stanford解析器检查句子是否在语法上正确

时间:2013-03-07 16:36:45

标签: python nlp grammar nltk stanford-nlp

是否有任何方法可以使用stanford解析器检查句子在语法上是否正确?截至目前,我可以使用stanford解析器获取句子的解析树。我被困在这里,不知道如何继续前进。

1 个答案:

答案 0 :(得分:0)

larsmans是正确的,那些解析器不是为此而设计的,但这是一个黑客:

您可以尝试使用解析器“置信度”。每个概率解析器计算不同标签的概率并分配最可能的序列。我尝试使用词性标注器(http://www.ark.cs.cmu.edu/TweetNLP/),其中每个标签都有一定的置信度(0.93,0.45等),我计算句子中所有标签的平均置信度并进行比较达到一定的置信度阈值(基于语料库中的其他句子)。

显然,如果标签的置信度不够高,我认为句子在语法上是不正确的。经过一些更多的启发式方法 - 比如照顾标点符号或单字句 - 它对我有用。

斯坦福解析器是概率性的并且肯定会计算概率,但我无法得到它的信任。也许你必须深入研究并了解如何揭露它。