我有一些文件以Annotation
格式从CoreNLP输出,我想将它们反序列化为CONLL-X DocumentReader
对象。 CoreNLP是否提供.conll
方法将Annotation
文件转换为---
title: "Untitled"
output: pdf_document
---
## R Markdown
```{r,echo=FALSE,out.width='.49\\linewidth', fig.width=3, fig.height=3}
barplot(1:4)
barplot(4:7)
```
对象,还是必须创建自己的DocumentReader?
答案 0 :(得分:1)
您可以尝试TSVSentenceIterator之类的内容,它会从类似CoNLL的格式化TSV文件中读取句子。
但是,请注意,悬挂在Annotation对象上的Annotations的数量远远超过CoNLL文件中的列数(例如,字符偏移等),因此这个序列化不会无损如果要保持对对象的注释,可能会出现意外行为。这不是官方支持的无损序列化策略之一。