如何在熊猫数据框上进行字数统计

时间:2019-01-28 07:12:18

标签: python pandas

我知道这可能很愚蠢,但是我为此问题所做的每项研究都导致了更复杂的问题,我仍然无法弄清基础知识,我只想计算单词的出现频率

这是我的数据

id descriptions
1  I love you
2  I love you too

这是我的预期输出

id descriptions      word count
1  I love you        3
2  I love you too    4

2 个答案:

答案 0 :(得分:1)

使用:

df['count'] = df['descriptions'].str.count(' ') + 1

或者:

df['count'] = df['descriptions'].str.split().str.len()

或者:

df['count'] = df['descriptions'].str.findall(r'(\w+)').str.len()

print (df)
   id    descriptions  count
0   1      I love you      3
1   2  I love you too      4

答案 1 :(得分:1)

您可以尝试:

df['word_count'] = df['description'].apply(lambda x: len(x.split())