我正在测试大约40多个列的多个表,因此我需要为每个单独的列逐个命令运行。有没有一种方法可以简化此过程?
答案 0 :(得分:0)
要对流程进行更多控制(即,如果要命名分组测试的每个结果),可以在df.groupby()
循环内遍历所有列的情况下使用for
。
仍然可以欣赏到一个最小的可复制示例。
更新:细节可能会有所不同,但是我会这样做,以便将每个分组的对象存储在键为列名的字典中:
cols = df.columns.values.tolist()
results = {}
for col in cols:
results[col] = df.groupby([col])
#End
但是,请注意,此操作将产生pandas.core.groupby.DataFrameGroupBy
个对象,这些对象不是数据帧。