如何ne_chunk nltk中的文件?

时间:2018-10-21 02:52:15

标签: nltk

import nltk    
file_content = open("C:\headlines.txt").read()    
tokens = nltk.word_tokenize(file_content)    
print(tokens)

输出

['West', 'Bengal', 'govt', '.', 'extends', 'food', 'security', 'to', '8.5',
 'crore', 'people', ':', 'Mamata', 'Govt', 'committed', 'to', 'implementing', 
 'SC', 'verdict', 'on', 'Sabarimala', ',', 'says', 'Kerala', 'CM', 'Pinarayi',
 'Vijayan', 'Polling', 'under', 'way', 'for', 'last', 'phase', 'of',
 'municipal', 'polls', 'in', 'Jammu', 'and', 'Kashmir', '.']

0 个答案:

没有答案