我知道这可能很愚蠢,但是我为此问题所做的每项研究都导致了更复杂的问题,我仍然无法弄清基础知识,我只想计算单词的出现频率
这是我的数据
id descriptions
1 I love you
2 I love you too
这是我的预期输出
id descriptions word count
1 I love you 3
2 I love you too 4
答案 0 :(得分:1)
使用:
df['count'] = df['descriptions'].str.count(' ') + 1
或者:
df['count'] = df['descriptions'].str.split().str.len()
或者:
df['count'] = df['descriptions'].str.findall(r'(\w+)').str.len()
print (df)
id descriptions count
0 1 I love you 3
1 2 I love you too 4
答案 1 :(得分:1)
您可以尝试:
df['word_count'] = df['description'].apply(lambda x: len(x.split())