我正在研究一个抄袭检测项目。我需要使用Stanford Parser API为存储在文本文件中的句子中的单词获取词性(POS)标签。
我知道班级edu.Stanford.nlp.parser.lexparser.LexicalizedParser
可以用于此目的。但我无法让它发挥作用。
有谁能告诉我如何在java中编写一个代码,可以利用这个类或API中的其他类来获取POS标签?
非常感谢
答案 0 :(得分:1)
查看分发中包含的初始文件ParserDemo.java
和ParserDemo2.java
。它们显示了在代码中调用解析器的简单示例。特别是,在ParserDemo2.java
中,请看到致电parse.taggedYield()
,该致电List
TaggedWord
tag()
,您可以从中请求每个项目的{{1}}。
但是,如果你想要的只是一个词性标注器,你会发现使用词性标注器(例如Stanford Part-of-Speech Tagger)会更快,内存更少。
答案 1 :(得分:0)
可以在此处找到Javadoc:http://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/parser/lexparser/package-summary.html
。请注意,程序包名称(edu.stanford.nlp.parser.lexparser
)区分大小写,并且您已编写Stanford
。这意味着你得到“ClassNotFoundException”。
您不会提供任何其他信息或错误消息,因此很难提供进一步的帮助。您是否需要帮助编译和运行Java包?如果是这样,在解决NLP之前解决这个问题。