Question

我有一个包含一些数据的文件，

我拥有的数据的一个例子

>>> pd.DataFrame(dict.fromkeys(s, []))
Empty DataFrame
Columns: [1_AA, 2_BB, 3_CC, 4_DD]
Index: []

我需要在文件中找到最常用的单词关于如何应用这些的任何想法？代码片段将被视为一个例子

Answer 1

您可以使用NLTK FreqDist方法计算单词并返回最常用的单词。