是否有库函数或将两个Pandas数据帧列堆叠在一起的正确方法?
例如,将4列设为2:
a1 b1 a2 b2
1 2 3 4
5 6 7 8
到
c d
1 2
5 6
3 4
7 8
我在大多数情况下阅读的Pandas Data Frames文档仅涉及连接行和进行行操作,但我确信必须有一种方法来完成我所描述的内容,我相信它非常简单。
任何帮助都会很棒。
答案 0 :(得分:3)
您可以使用pandas.DataFrame.iloc
选择前两列和后两列。然后,将两个部分的列名更改为c
和d
。之后,您可以使用pandas.concat
加入他们。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(1, 9).reshape((2, 4)),
columns=["a1", "b1", "a2", "b2"])
part1 = df.iloc[:,0:2]
part2 = df.iloc[:,2:4]
new_columns = ["c", "d"]
part1.columns = new_columns
part2.columns = new_columns
print pd.concat([part1, part2], ignore_index=True)
这会给你:
c d
0 1 2
1 5 6
2 3 4
3 7 8
答案 1 :(得分:1)
我会做以下
import pandas as pd
df = pd.DataFrame({'a1' : pd.Series([1,5]), 'b1' : pd.Series([2,6]), 'a2' : pd.Series([3,7]), 'b2' : pd.Series([4,8])})
df1 = df[['a1','b1']]
df2 = df[['a2','b2']]
df1.columns = ['c','d']
df2.columns = ['c','d']
df1.append(df2)
我刚看到@Carsten也回答了这个问题,我同意他的回答
答案 2 :(得分:0)
或者,使用melt:
# Make data as in previous answers
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(1, 9).reshape((2, 4)),
columns=["a1", "b1", "a2", "b2"])
# Melt both columns and concatenate
df = pd.concat([
df[['a1', 'a2']].melt(value_name='c'),
df[['b1', 'b2']].melt(value_name='d')],
axis=1)
# Discard unwanted columns melt creates
df = df[['c', 'd']]