应用错误收集

如何使用Stanford Parser使用java获取POS标签？

时间：2012-12-15 16:50:11

标签： java parsing stanford-nlp speech

我正在研究一个抄袭检测项目。我需要使用Stanford Parser API为存储在文本文件中的句子中的单词获取词性（POS）标签。

我知道班级edu.Stanford.nlp.parser.lexparser.LexicalizedParser可以用于此目的。但我无法让它发挥作用。

有谁能告诉我如何在java中编写一个代码，可以利用这个类或API中的其他类来获取POS标签？

非常感谢

2 个答案:

答案 0 :(得分：1)

查看分发中包含的初始文件ParserDemo.java和ParserDemo2.java。它们显示了在代码中调用解析器的简单示例。特别是，在ParserDemo2.java中，请看到致电parse.taggedYield()，该致电List TaggedWord tag()，您可以从中请求每个项目的{{1}}。

但是，如果你想要的只是一个词性标注器，你会发现使用词性标注器（例如Stanford Part-of-Speech Tagger）会更快，内存更少。

答案 1 :(得分：0)

可以在此处找到Javadoc：http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html。请注意，程序包名称（edu.stanford.nlp.parser.lexparser）区分大小写，并且您已编写Stanford。这意味着你得到“ClassNotFoundException”。

您不会提供任何其他信息或错误消息，因此很难提供进一步的帮助。您是否需要帮助编译和运行Java包？如果是这样，在解决NLP之前解决这个问题。