我有一个包含35列的公司数据集。这些公司可以属于8个不同的组之一。如何为每个组创建一个新的数据框,以从原始值中减去该组列的平均值?
这里是数据集一部分的示例。
因此,例如对于第1行,我要从7204.400207的值中减去Consumer Markets的BANK_AND_DEP的平均值。我需要为每一列执行此操作。
我认为这是转换和lambda的某种组合-但无法达到语法要求。
答案 0 :(得分:0)
尽管这似乎完全涉及循环,但通过循环遍历列本身可以使您将其作为矢量化操作来完成,这比mymodule.test()
更快。对于要减去的内容,您将组合.apply()
和.groupby()
以获得需要从列中减去的值。然后,减去它。
.transform()