我正在使用没有金edu.stanford.nlp.parser.lexparser.LexicalizedParser
的斯坦福解析器(POS-tag
),而且在Penn风格中,它正常工作。
我的测试文件是:
(ROOT (S (NP (NNS People)) (VP (MD can) (VP (VB butter) (NP (PRP$ their) (NN bread)) (PP (IN with) (NP (DT a) (NN knife))))) (. .)))
但是,当我想使用-tagSeparator
成功构建的火车模型时,使用黄金POS作为我的测试集,但测试阶段完成了解析0句(没有错误并忽略测试句)。
我的测试文件是:
People/NNS can/MD butter/VB their/PRP$ bread/NN with/IN a/DT knife/NN ./.
我阅读this并使用此命令解析我的测试句子:
java -mx1500m -cp "*" edu.stanford.nlp.parser.lexparser.LexicalizedParser -sentences newline -tokenized -tagSeparator / -tokenizerFactory edu.stanford.nlp.process.WhitespaceTokenizer -tokenizerMethod newCoreLabelTokenizerFactory -headFinder edu.stanford.nlp.trees.LeftHeadFinder -train trainpath -testTreebank testpath
是否有单独的命令用于此目的(强制解析器使用这些标记)?
由于