如何使用Corenlp将.conll文件加载到Annotation对象中?

时间:2016-05-09 11:59:25

标签: java nlp stanford-nlp

我有一些文件以Annotation格式从CoreNLP输出,我想将它们反序列化为CONLL-X DocumentReader对象。 CoreNLP是否提供.conll方法将Annotation文件转换为--- title: "Untitled" output: pdf_document --- ## R Markdown ```{r,echo=FALSE,out.width='.49\\linewidth', fig.width=3, fig.height=3} barplot(1:4) barplot(4:7) ``` 对象,还是必须创建自己的DocumentReader?

1 个答案:

答案 0 :(得分:1)

您可以尝试TSVSentenceIterator之类的内容,它会从类似CoNLL的格式化TSV文件中读取句子。

但是,请注意,悬挂在Annotation对象上的Annotations的数量远远超过CoNLL文件中的列数(例如,字符偏移等),因此这个序列化不会无损如果要保持对对象的注释,可能会出现意外行为。这不是官方支持的无损序列化策略之一。