如何使用pycharm应用TFIDF在csv文件中查找重要单词

时间:2017-05-27 10:34:36

标签: python csv nltk tf-idf

我有一个包含一些数据的文件,

我拥有的数据的一个例子

>>> pd.DataFrame(dict.fromkeys(s, []))
Empty DataFrame
Columns: [1_AA, 2_BB, 3_CC, 4_DD]
Index: []

我需要在文件中找到最常用的单词 关于如何应用这些的任何想法?代码片段将被视为一个例子

1 个答案:

答案 0 :(得分:0)

您可以使用NLTK FreqDist方法计算单词并返回最常用的单词。