给定一个pandas数据帧我想逐个地将每列与其他列相乘,并将每个新列作为新列返回到该数据帧。例如
A B C
1 2 3
2 4 4
1 2 5
然后
A B C A*B A*C B*C
1 2 2 2 3 6
2 4 8 8 8 16
1 2 2 2 5 10
答案 0 :(得分:2)
以下是一种暴力方法,但它应该完成这项工作。 permutations()
生成所有列排列。内部sorted()
和set()
合并('A','B')
与('B','A')
等。
import pandas as pd
import itertools
df = pd.DataFrame([[1,2,1],[2,4,2],[3,4,5]],columns=['A','B','C'])
for c1,c2 in sorted(set([tuple(sorted(s)) for s in itertools.permutations(df.columns,2)])):
df['{0}x{1}'.format(c1,c2)] = df[c1]*df[c2]
print df
答案 1 :(得分:1)
combinations
的 itertools
执行您正在寻找的内容:
import pandas as pd
from itertools import combinations
for c1, c2 in combinations(df.columns, 2):
df['{0}*{1}'.format(c1,c2)] = df[c1] * df[c2]
df
现在包含您想要的列:
A B C A*B A*C B*C
0 1 2 1 2 1 2
1 2 4 2 8 4 8
2 3 4 5 12 15 20
如果您不想将所有内容保存在内存中,您可以动态计算产品:
for c1, c2 in combinations(df.columns, 2):
s = df[c1] * df[c2]
# Do whatever is necessary with s
print c1, c2, s.apply(lambda x: x ** 0.5).mean()
输出:
A B 2.56891410075
A C 2.29099444874
B C 2.90492554737