Stanford CoreNLP - 加载带注释的文件而不是注释方法

时间:2018-04-12 14:22:42

标签: java stanford-nlp pretty-print

我用" prettyprint"获得了一个文件。方法,我会加载它而不是使用" annotate"方法。但我无法找到使用的方法。 我使用stanford-corenlp-3.9.0和api。 谢谢。

1 个答案:

答案 0 :(得分:1)

如果要在文件上运行一次管道,然后保存结果并在以后从文件加载它们,则需要使用我们提供的protobuf序列化功能。我们没有任何方法可以加载jsontext并从中构建注释。

ProtobufAnnotationSerializer serializer = new ProtobufAnnotationSerializer();
File inputFile = ...;
Annotation ann = serializer.readUndelimited(inputFile);

如果您运行管道,则可以输出带有-outputFormat serialized-serializer edu.stanford.nlp.pipeline.ProtobufAnnotationSerializer

的序列化文件

它处理的每个文件都是一个协议缓冲区,代表该文件的注释。