我刚刚从项目GRIAL下载了一个西班牙语Wordnet,格式为XML。我怎样才能在Python NLTK中使用它?
除此之外,您可以在同一页面下载西班牙语的标记语料库。我怎样才能加入它?
答案 0 :(得分:2)
使用XMLCorpusReader将XML数据作为语料库加载
这是执行该操作的代码
from nltk.corpus.reader import XMLCorpusReader
reader = XMLCorpusReader(dir, file)
使用XMLCorpusReader的完整工作示例为here