Question

我知道这可能很愚蠢，但是我为此问题所做的每项研究都导致了更复杂的问题，我仍然无法弄清基础知识，我只想计算单词的出现频率

这是我的数据

id descriptions
1  I love you
2  I love you too

这是我的预期输出

id descriptions      word count
1  I love you        3
2  I love you too    4

Answer 1

使用：

df['count'] = df['descriptions'].str.count(' ') + 1

或者：

df['count'] = df['descriptions'].str.split().str.len()

或者：

df['count'] = df['descriptions'].str.findall(r'(\w+)').str.len()

print (df)
   id    descriptions  count
0   1      I love you      3
1   2  I love you too      4

Answer 2

您可以尝试：

df['word_count'] = df['description'].apply(lambda x: len(x.split())