我想知道是否可以根据该列内的数据对pandas列进行分组,但我一直以不同的方式进行操作,但这并不好。作业需要处理大熊猫。
非常感谢
答案 0 :(得分:0)
variable = data_frame.groupby('column_name')
是的,您可以在数据帧上使用groupby命令并将列名作为参数传递,从而轻松地处理数据
答案 1 :(得分:0)
下面的代码是一个示例,其中.groupby()
用于计算水果总数,即.sum()
。在这里,grouped
列是fruits
,而sum
在quantity
列上方。请注意,.sum()
可以用任何其他统计信息来代替,例如.mean()
,.count()
等。其他信息可以在here和here中找到。
# Import libraries
import pandas as pd
# Create DataFrame
df = pd.DataFrame({
'fruits':['apple','apple','apple','orange','orange'],
'quantity': [1,2,3,4,5]
})
# Groupby to count total quantity of 'apples' and 'oranges'
dfnew = df.groupby(['fruits'])['quantity'].sum().reset_index()
# Rename columns
dfnew.columns = ['fruits', 'sum_quantity']
输出
dfnew
fruits sum_quantity
0 apple 6
1 orange 9