是否有办法创建语料库而无需在文件中包含项目。例如,我想操纵我从网上抓取的推文或段落。我可以做点什么吗
myCorpus = MyCorpus([
('id', 'item', 'category'),
('id', 'item', 'category'),
('id', 'item', 'category'),
... ])
或者
myCorpus.add('id', 'item', 'category')
目的是使用现有的NLTK功能操纵语料库。我检查了TextCollection
,但似乎它没有处理类别。
答案 0 :(得分:-1)
为什么不将字符串写入文件或文件,然后将其作为语料库处理?