如何使用PlaintextCorpusReader模块加载一个文本文件语料库

时间:2016-01-16 13:20:30

标签: nltk

我只能这样做:

`来自nltk.corpus导入PlaintextCorpusReader

  
    
      

corpus_root =' / usr / share / dict'       wordlists = PlaintextCorpusReader(corpus_root,'。*')       wordlists.fileids()`

    
  

如果我只有一个文件,因为我的语料库中有一个有效的代码来直接选择该文件而不是这个方法,这对于语料库来说是很多文本文件

0 个答案:

没有答案