标签: python csv nltk tf-idf
我有一个包含一些数据的文件,
我拥有的数据的一个例子
>>> pd.DataFrame(dict.fromkeys(s, [])) Empty DataFrame Columns: [1_AA, 2_BB, 3_CC, 4_DD] Index: []
我需要在文件中找到最常用的单词 关于如何应用这些的任何想法?代码片段将被视为一个例子
答案 0 :(得分:0)
您可以使用NLTK FreqDist方法计算单词并返回最常用的单词。
FreqDist