我可以从NLTK中的字符串集合创建语料库吗?

时间:2010-12-27 14:57:32

标签: collections nltk corpus

是否有办法创建语料库而无需在文件中包含项目。例如,我想操纵我从网上抓取的推文或段落。我可以做点什么吗

myCorpus = MyCorpus([
    ('id', 'item', 'category'), 
    ('id', 'item', 'category'),
    ('id', 'item', 'category'), 
    ... ])

或者

myCorpus.add('id', 'item', 'category')

目的是使用现有的NLTK功能操纵语料库。我检查了TextCollection,但似乎它没有处理类别。

1 个答案:

答案 0 :(得分:-1)

为什么不将字符串写入文件或文件,然后将其作为语料库处理?