Python:如何在DataFrame中聚合值

时间:2017-10-16 01:07:12

标签: python dataframe

我的数据框值低于

Text                                State
This is a beutiful day              California
But I am stuck with code            New York
It's too hard                       California
Can somebody please help me         Florida
I am new to python                  Florida
How should I solve this problem     New York
Day is turning bad                  New York
I am getting exhaused               California
Need some help                      New York

我需要明智地计算文本状态的情绪分​​析。我如何明智地汇总文本,然后进行情绪分析。

df = df.groupby(df.columns.difference(['Text']))
result = pd.DataFrame(df['State'].unique(), columns=df.columns)

我试图以这种方式首先聚合文本,但它不起作用。需要一些聚合建议,然后如何在数据框中使用循环进行情感分析。

1 个答案:

答案 0 :(得分:1)

您可以使用lambda函数对文本进行分组,该函数使用提供的分隔符获取文本和联接。

`delimiter = ' '
df2 =  df.groupby('State')['Text'].apply(lambda x: "%s" % delimiter.join(x)).reset_index()
print (df2)`

添加reset.index()会转换为您需要的数据框