如何将两个Pandas Dataframe列叠加在一起?

时间:2014-12-16 21:05:30

标签: python pandas dataframe data-analysis

是否有库函数或将两个Pandas数据帧列堆叠在一起的正确方法?

例如,将4列设为2:

a1  b1  a2  b2
 1   2   3   4
 5   6   7   8

c   d
1   2
5   6
3   4
7   8

我在大多数情况下阅读的Pandas Data Frames文档仅涉及连接行和进行行操作,但我确信必须有一种方法来完成我所描述的内容,我相信它非常简单。

任何帮助都会很棒。

3 个答案:

答案 0 :(得分:3)

您可以使用pandas.DataFrame.iloc选择前两列和后两列。然后,将两个部分的列名更改为cd。之后,您可以使用pandas.concat加入他们。

import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(1, 9).reshape((2, 4)),
        columns=["a1", "b1", "a2", "b2"])

part1 = df.iloc[:,0:2]
part2 = df.iloc[:,2:4]

new_columns = ["c", "d"]
part1.columns = new_columns
part2.columns = new_columns

print pd.concat([part1, part2], ignore_index=True)

这会给你:

   c  d
0  1  2
1  5  6
2  3  4
3  7  8

答案 1 :(得分:1)

我会做以下

import pandas as pd
df = pd.DataFrame({'a1' : pd.Series([1,5]), 'b1' : pd.Series([2,6]), 'a2' : pd.Series([3,7]), 'b2' : pd.Series([4,8])})

df1 = df[['a1','b1']]
df2 = df[['a2','b2']]
df1.columns = ['c','d']
df2.columns = ['c','d']
df1.append(df2)

我刚看到@Carsten也回答了这个问题,我同意他的回答

答案 2 :(得分:0)

或者,使用melt

# Make data as in previous answers 
import pandas as pd
import numpy as np

df = pd.DataFrame(np.arange(1, 9).reshape((2, 4)),
                  columns=["a1", "b1", "a2", "b2"])

# Melt both columns and concatenate 
df = pd.concat([
    df[['a1', 'a2']].melt(value_name='c'), 
    df[['b1', 'b2']].melt(value_name='d')], 
    axis=1)

# Discard unwanted columns melt creates
df = df[['c', 'd']]