我有一个CoNLL-X格式树库和每个句子的相应二进制分析树,我想将其转换为PTB格式。是否有任何转换器或任何人可以阐明PTB格式?
答案 0 :(得分:3)
从依赖关系(以CoNLL-X格式表示)转换为成分(可在Penn Treebank或PTB格式中表示)已经做了很多努力。最近的两篇论文及其代码:
Transforming Dependencies into Phrase Structures(Kong,Rush和Smith,NAACL 2015)。 Code
Parsing as Reduction(Fernandez-Gonzalez和Martins,ACL 2015)。 Code