如何将每列与Pandas DataFrame的其他列相乘?

时间:2015-03-24 10:15:26

标签: python pandas

给定一个pandas数据帧我想逐个地将每列与其他列相乘,并将每个新列作为新列返回到该数据帧。例如

A B C
1 2 3
2 4 4
1 2 5

然后

A B C A*B   A*C     B*C
1 2 2  2     3       6
2 4 8  8     8       16
1 2 2  2     5       10

2 个答案:

答案 0 :(得分:2)

以下是一种暴力方法,但它应该完成这项工作。 permutations()生成所有列排列。内部sorted()set()合并('A','B')('B','A')等。

import pandas as pd
import itertools

df = pd.DataFrame([[1,2,1],[2,4,2],[3,4,5]],columns=['A','B','C'])

for c1,c2 in sorted(set([tuple(sorted(s)) for s in itertools.permutations(df.columns,2)])):
  df['{0}x{1}'.format(c1,c2)] = df[c1]*df[c2]

print df

答案 1 :(得分:1)

来自combinations

itertools执行您正在寻找的内容:

import pandas as pd
from itertools import combinations

for c1, c2 in combinations(df.columns, 2):
    df['{0}*{1}'.format(c1,c2)] = df[c1] * df[c2]

df现在包含您想要的列:

   A  B  C  A*B  A*C  B*C
0  1  2  1    2    1    2
1  2  4  2    8    4    8
2  3  4  5   12   15   20

如果您不想将所有内容保存在内存中,您可以动态计算产品:

for c1, c2 in combinations(df.columns, 2):
    s = df[c1] * df[c2]
    # Do whatever is necessary with s
    print c1, c2, s.apply(lambda x: x ** 0.5).mean()

输出:

A B 2.56891410075
A C 2.29099444874
B C 2.90492554737