我正在研究伪造新闻检测,我的特点之一是语法上的弱点表明新闻是伪造的。 现在,我面临一个无法找到检测语法弱点的方法的问题。我尝试使用Stanford Parser,但无法确定要使用的类。 我应该说我正在使用Java。
得出结论:解析器的输入是句子,而输出是该句子中的错误数。
谢谢。
答案 0 :(得分:0)
您可以通过以下方式运行斯坦福解析器:
java -mx150m -cp "stanford-parser.jar;" edu.stanford.nlp.parser.lexparser.LexicalizedParser -outputFormat "wordsAndTags" -printPCFGkBest 1 englishPCFG.ser.gz <input-file>
其中包含您的英语句子。
解析器将输出解析的概率,我们可以将其用作正确性的指标。