我写了一个代码来拆分单词并计算频率。但是,结果与在我的csv文件中尝试按CTRL + F时找到的结果不匹配。怎么了?
split = df.text.str.split(expand=True).stack().value_counts()
结果:
de 3090
e 2178
a 2136
o 1957
do 1600
que 1457
para 1258
da 1179
com 997
em 963
例如,单词“ que”在CSV中有1471个结果。否则,“ de”一词的值为2757。