例如,df1是3 * 2数据帧,df2是10 * 3数据帧,我想要的是生成一个30 * 5的新数据帧,其中df1中的每一行都附加了3列df2对于df2中的所有10行。
我知道我可以使用迭代将df2的列附加到df1的每一行,但我想知道是否有一些更有效的方法在pandas中执行此操作,例如它的concat函数。
有人可以帮忙吗?
的问候, 南
答案 0 :(得分:9)
如果我了解你,你需要cartesian product。您可以使用pandas中的合并来模拟它:
>>> df1 = pd.DataFrame({'A':list('abc'), 'B':range(3)})
>>> df2 = pd.DataFrame({'C':list('defg'), 'D':range(3,7)})
>>> df1['key'] = 1
>>> df2['key'] = 1
>>> df = pd.merge(df1, df2, on='key')
>>> del df['key']
>>> df
A B C D
0 a 0 d 3
1 a 0 e 4
2 a 0 f 5
3 a 0 g 6
4 b 1 d 3
5 b 1 e 4
6 b 1 f 5
7 b 1 g 6
8 c 2 d 3
9 c 2 e 4
10 c 2 f 5
11 c 2 g 6