如何使用Stanford Parser使用java获取POS标签?

时间:2012-12-15 16:50:11

标签: java parsing stanford-nlp speech

我正在研究一个抄袭检测项目。我需要使用Stanford Parser API为存储在文本文件中的句子中的单词获取词性(POS)标签。

我知道班级edu.Stanford.nlp.parser.lexparser.LexicalizedParser可以用于此目的。但我无法让它发挥作用。

有谁能告诉我如何在java中编写一个代码,可以利用这个类或API中的其他类来获取POS标签?

非常感谢

2 个答案:

答案 0 :(得分:1)

查看分发中包含的初始文件ParserDemo.javaParserDemo2.java。它们显示了在代码中调用解析器的简单示例。特别是,在ParserDemo2.java中,请看到致电parse.taggedYield(),该致电List TaggedWord tag(),您可以从中请求每个项目的{{1}}。

但是,如果你想要的只是一个词性标注器,你会发现使用词性标注器(例如Stanford Part-of-Speech Tagger)会更快,内存更少。

答案 1 :(得分:0)

可以在此处找到Javadoc:http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html。请注意,程序包名称(edu.stanford.nlp.parser.lexparser)区分大小写,并且您已编写Stanford。这意味着你得到“ClassNotFoundException”。

您不会提供任何其他信息或错误消息,因此很难提供进一步的帮助。您是否需要帮助编译和运行Java包?如果是这样,在解决NLP之前解决这个问题。