计算数据框中的单词数时出了什么问题?

时间:2019-09-06 19:39:20

标签: python dataframe frequency

我写了一个代码来拆分单词并计算频率。但是,结果与在我的csv文件中尝试按CTRL + F时找到的结果不匹配。怎么了?

split = df.text.str.split(expand=True).stack().value_counts()

结果:

de                          3090
e                           2178
a                           2136
o                           1957
do                          1600
que                         1457
para                        1258
da                          1179
com                          997
em                           963

例如,单词“ que”在CSV中有1471个结果。否则,“ de”一词的值为2757。

0 个答案:

没有答案