我从普遍依赖关系中获取数据,我主要在印度尼西亚语(bahasa)工作,所以我克隆了仓库:
两个仓库都包含bz2文件,解压缩后,我得到了包含的文件。那里的所有内容都是conllul格式。所以我尝试使用命令
将其转换为spacy的json格式 python -m spacy convert thefile.conllul .
但是,spacy投掷错误消息:
Unknown format
Can't find converter for conllul
如何进行转换?
conllul
和conll
格式是同一回事吗?如果没有,如何将conllul
转换为conll
格式?提前谢谢
答案 0 :(得分:0)
好,在回答您的问题之前,让我们先澄清一下。
以下陈述是正确的:
考虑到所有这些,我想您的问题的答案将是为您的语言使用conllu格式,这是使用自然语言处理带有杂凑的标准方法。我发现您的语言在ud treebank集合中有格式的数据。您可以从here下载数据,然后使用spacy转换器将其转换为json。
我真的希望能有所帮助。 :)