Pandas Dataframe合并了2列

时间:2017-09-22 13:02:20

标签: pandas dataframe stack reshape melt

我有这样的数据表:

Run, test1, test2
1, 100, 102.
2, 110, 100.
3, 108, 105.

我想将2列合并在一起,如下所示:

Run, results
1, 100
1, 102
2, 110 
2, 100 
3, 108 
3, 105

我如何在熊猫中做到这一点?非常感谢!

2 个答案:

答案 0 :(得分:2)

stackMultiindex一起使用到列reset_index列:

df = df.set_index('Run').stack().reset_index(drop=True, level=1).reset_index(name='results')
print (df)
   Run  results
0    1    100.0
1    1    102.0
2    2    110.0
3    2    100.0
4    3    108.0
5    3    105.0

melt

df = df.melt('Run', value_name='results').drop('variable', axis=1).sort_values('Run')
print (df)
   Run  results
0    1    100.0
3    1    102.0
1    2    110.0
4    2    100.0
2    3    108.0
5    3    105.0

使用numpy.repeat的Numpy解决方案:

a = np.repeat(df['Run'].values, 2)
b = df[['test1','test2']].values.flatten()

df = pd.DataFrame({'Run':a , 'results': b}, columns=['Run','results'])
print (df)
   Run  results
0    1    100.0
1    1    102.0
2    2    110.0
3    2    100.0
4    3    108.0
5    3    105.0

答案 1 :(得分:2)

这是我如何实现这个

选项1

wide_to_long

pd.wide_to_long(df,stubnames='test',i='Run',j='LOL').reset_index().drop('LOL',1)
Out[776]: 
    Run   test
0    1  100.0
1    2  110.0
2    3  108.0
3    1  102.0
4    2  100.0
5    3  105.0

注意:这里我没有将列名从测试更改为结果,我认为使用test作为新列名称在您的情况下更好。

选项2

pd.concat

df=df.set_index('Run')
pd.concat([df[Col] for Col in df.columns],axis=0).reset_index().rename(columns={0:'results'})

Out[786]: 
   Run  results
0    1    100.0
1    2    110.0
2    3    108.0
3    1    102.0
4    2    100.0
5    3    105.0