我正在研究一个项目,通过阅读难度对中文句子进行分类,我想尝试这个特征:句子的语法正确解析(读数)。
前。在英语中,"我用一把尺子打了那个男人"可能是"I hit [the man with a ruler]"
或"I hit [the man] with a ruler."
所以我想要
sentence = ["I","hit","the","man","with","the","ruler"]
print(function(sentence))
打印2
。
我在NLTK与斯坦福大学中文分析师的界面中工作,尝试用中文句子(已经被标记为单词列表)。 Stanford NLP's FAQ page表示您可以使用" -printPCFGkBest n"为单个输入句子获取多个解析树。选项,这似乎是朝着正确方向迈出的一步,但是 我无法弄清楚如何在NLTK中使用这个选项 2.是否有可能以这种方式解决所有语法问题?
感谢您提供任何帮助或建议。