import nltk
import nltk.data
nltk.corpus.brown
y= nltk.corpus.brown.raw()
print(y)
当我print(y)
时,它会显示此语料库中的所有原始数据,
但我想从这个原始语料库中只得到10,000
个单词。
我怎样才能做到这一点?
答案 0 :(得分:2)
你可以这样做:
import random
words = nltk.corpus.brown.words()
random_words = random.sample(words, 10000)