我想使用不同的分组变量来计算python中数组的平均值。例如,我要计算ANDing! (not 'and')
和column1
的{{1}}中所有值的平均值。
我已经尝试了for循环和if循环,但是它看起来极其复杂,而且对于我的数据维度来说也太令人困惑了。是否有另一种方法可以将某些条件下的数据分组并分别计算每个条件组合的平均值?
我正在R中寻找像column2 == 2
,column3 == a + 3
或group_by()
这样的函数,仅用于python。
这是我到目前为止尝试过的循环:
summarise()
答案 0 :(得分:0)
我建议您结帐Pandas,它确实满足您的需求。
在python世界中,Pandas是针对您所描述的数据分析任务的最终解决方案。
一旦将数据(最好是.csv格式)导入熊猫:
import pandas as pd
df = pd.read_csv('filepath_to_your_data')
## I want to calculate the mean of all values in column1, for which column2 == 2 and column3 == a + 3
df[(df.column2==2) & (df.column3 == a+3)].loc[:, 'column1'].mean()
熊猫还提供groupby
,describe
和agg