Java中的Stanford POS标记

时间:2009-12-23 18:59:18

标签: java stanford-nlp pos-tagger

我正在尝试这个:

Sentence<TaggedWord> taggedString = MaxentTagger.tagStringTokenized("here is a string to tag");

给了我:

  

错误:   \ u \ nlp \ data \ pos-tagger \ wsj3t0-18-left3words \ left3words-wsj-0-18.tagger(系统无法找到路径   指定)

我正在使用斯坦福大学的POS tagger

我该怎么做才能解决这个问题?

2 个答案:

答案 0 :(得分:4)

您似乎首先必须实例化传递包含文件的标记:

new MaxentTagger("models/left3words-wsj-0-18.tagger");

由于稍后使用的标记方法是静态的,因此非常讨厌:

MaxentTagger.tagStringTokenized("here is a string to tag");

我还必须通过-Xmx256m才能使其与该设置一起运行。

答案 1 :(得分:2)

它说它找不到那条路。那么,它是否存在于您的机器上?

请注意,斜杠是反斜杠 - 您的操作系统是否支持反斜杠作为文件分隔符?

还要注意它是一条绝对的路径 - 这是有意的吗?

如果一切正常,该文件是否存在?

编辑:如果没有,您应该在此处下载(http://github.com/tiendung/ruby-nlp/blob/master/left3words-wsj-0-18.tagger),将其放在系统指定的路径中,看看会发生什么。