根据列内的数据对列进行分组

时间:2020-07-08 04:14:20

标签: python pandas

我想知道是否可以根据该列内的数据对pandas列进行分组,但我一直以不同的方式进行操作,但这并不好。作业需要处理大熊猫。

非常感谢

2 个答案:

答案 0 :(得分:0)

variable = data_frame.groupby('column_name')

是的,您可以在数据帧上使用groupby命令并将列名作为参数传递,从而轻松地处理数据

答案 1 :(得分:0)

下面的代码是一个示例,其中.groupby()用于计算水果总数,即.sum()。在这里,grouped列是fruits,而sumquantity列上方。请注意,.sum()可以用任何其他统计信息来代替,例如.mean().count()等。其他信息可以在herehere中找到。

# Import libraries
import pandas as pd

# Create DataFrame
df = pd.DataFrame({
    'fruits':['apple','apple','apple','orange','orange'],
    'quantity': [1,2,3,4,5]
})

# Groupby to count total quantity of 'apples' and 'oranges'
dfnew = df.groupby(['fruits'])['quantity'].sum().reset_index()

# Rename columns
dfnew.columns = ['fruits', 'sum_quantity']

输出

dfnew

   fruits  sum_quantity
0   apple             6
1  orange             9