标签: nltk
我只能这样做:
`来自nltk.corpus导入PlaintextCorpusReader
corpus_root =' / usr / share / dict' wordlists = PlaintextCorpusReader(corpus_root,'。*') wordlists.fileids()`
如果我只有一个文件,因为我的语料库中有一个有效的代码来直接选择该文件而不是这个方法,这对于语料库来说是很多文本文件