我有这样的数据表:
Run, test1, test2
1, 100, 102.
2, 110, 100.
3, 108, 105.
我想将2列合并在一起,如下所示:
Run, results
1, 100
1, 102
2, 110
2, 100
3, 108
3, 105
我如何在熊猫中做到这一点?非常感谢!
答案 0 :(得分:2)
将stack
与Multiindex
一起使用到列reset_index
列:
df = df.set_index('Run').stack().reset_index(drop=True, level=1).reset_index(name='results')
print (df)
Run results
0 1 100.0
1 1 102.0
2 2 110.0
3 2 100.0
4 3 108.0
5 3 105.0
或melt
:
df = df.melt('Run', value_name='results').drop('variable', axis=1).sort_values('Run')
print (df)
Run results
0 1 100.0
3 1 102.0
1 2 110.0
4 2 100.0
2 3 108.0
5 3 105.0
使用numpy.repeat
的Numpy解决方案:
a = np.repeat(df['Run'].values, 2)
b = df[['test1','test2']].values.flatten()
df = pd.DataFrame({'Run':a , 'results': b}, columns=['Run','results'])
print (df)
Run results
0 1 100.0
1 1 102.0
2 2 110.0
3 2 100.0
4 3 108.0
5 3 105.0
答案 1 :(得分:2)
这是我如何实现这个
选项1
pd.wide_to_long(df,stubnames='test',i='Run',j='LOL').reset_index().drop('LOL',1)
Out[776]:
Run test
0 1 100.0
1 2 110.0
2 3 108.0
3 1 102.0
4 2 100.0
5 3 105.0
注意:这里我没有将列名从测试更改为结果,我认为使用test作为新列名称在您的情况下更好。
选项2
pd.concat
df=df.set_index('Run')
pd.concat([df[Col] for Col in df.columns],axis=0).reset_index().rename(columns={0:'results'})
Out[786]:
Run results
0 1 100.0
1 2 110.0
2 3 108.0
3 1 102.0
4 2 100.0
5 3 105.0