从列值减去列的组均值

时间:2020-04-30 15:57:59

标签: pandas pandas-groupby mean

我有一个包含35列的公司数据集。这些公司可以属于8个不同的组之一。如何为每个组创建一个新的数据框,以从原始值中减去该组列的平均值?

这里是数据集一部分的示例。

enter image description here

因此,例如对于第1行,我要从7204.400207的值中减去Consumer Markets的BANK_AND_DEP的平均值。我需要为每一列执行此操作。

我认为这是转换和lambda的某种组合-但无法达到语法要求。

1 个答案:

答案 0 :(得分:0)

尽管这似乎完全涉及循环,但通过循环遍历列本身可以使您将其作为矢量化操作来完成,这比mymodule.test()更快。对于要减去的内容,您将组合.apply().groupby()以获得需要从列中减去的值。然后,减去它。

.transform()