Stanford POS标记:-filelist选项不起作用

时间:2017-10-14 00:59:20

标签: stanford-nlp

我正在尝试在一系列文件上运行Stanford POS标记器,但我遇到了-filelist option的问题。每当我使用-filelist运行命令时,我都会被要求输入文本,这是没有指定文件时的默认值。但文件列表是以其完整路径给出的(文件存在于那里 - 我仔细检查过),该文件包含两个文件的名称,同样是完整路径,每行一个(也是双重检查,它们在那里)

我的电话,来自Linux(Mint)终端:

java -mx2g -classpath stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model models/english-bidirectional-distsim.tagger -filelist /home/kevin/filelist.test

(为了突出问题,我没有包含输出选项。当然,我已经尝试了各种各样的选项。)当然,我已经将文件列表移动到工作目录中以及各种其他可能的补救措施没用。

请注意,如果我将-filelist切换为-textFile,它会标记该文件,即使它们只是文件位置 - 这是无用的,但它会显示其他所有内容都有效。

同样,我没有收到任何错误。它只是无法识别文件列表并提示我键入要标记的文本。尝试使用相同或类似操作系统的两台不同的机器,遇到同样的问题。

无法提供任何可重现的代码,但我很乐意根据要求提供任何进一步的信息。请注意我没有Java经验。

1 个答案:

答案 0 :(得分:0)

据我所知,独立的POS标记器分发没有文件列表选项。您想要使用完整的管道。

这里有大量文档:

https://stanfordnlp.github.io/CoreNLP/download.html