重复数据框,具有不同的列值

时间:2015-03-19 15:31:41

标签: python pandas

我有以下数据框,需要重复一组值的值。也就是说,给定

test3 = pd.DataFrame(data={'x':[1, 2, 3, 4, pd.np.nan], 'y':['a', 'a', 'a', 'b', 'b']})
test3
    x  y
0   1  a
1   2  a
2   3  a
3   4  b
4 NaN  b

我需要做这样的事情,但性能更高:

test3['group'] = np.NaN
groups = ['a', 'b']
dfs = []
for group in groups:
       temp = test3.copy()
       temp['group'] = group 
       dfs.append(temp)
pd.concat(dfs)

即,预期输出为:

    x  y group
0   1  a     a
1   2  a     a
2   3  a     a
3   4  b     a
4 NaN  b     a
0   1  a     b
1   2  a     b
2   3  a     b
3   4  b     b
4 NaN  b     b

0 个答案:

没有答案