pandas - 两个日期框架合并为一列

时间:2018-05-06 08:39:31

标签: python pandas

我有两个数据帧

df = pd.DataFrame({'A': [1,2,3,4], 'B': [5,6,7,8], 'C': [9,10,11,12]})

df2 = pd.DataFrame({'A': ['a','b','c','d'], 'B': ['e','f','g','h'], 'C': ['i','j','k','l']})

我正在尝试合并两个数据框,但也将每个列的标题添加到一个单独的列中。我想要制作的是下面。

df3 = pd.DataFrame({'Serial': ['a','b','c','d','e','f','g','h','i','j','k','l'],
                'Cost': [1,2,3,4,5,6,7,8,9,10,11,12],
                'Name': ['A','A','A','A','B','B','B','B','C','C','C','C']})

我已经尝试过迭代列但最终弄得一团糟。

1 个答案:

答案 0 :(得分:3)

这是单程

In [33]: (pd.concat([df.unstack(), df2.unstack()], axis=1).reset_index()
           .drop('level_1', 1)
           .rename(columns={'level_0': 'Name', 0: 'Cost', 1: 'Serial'}))
Out[33]:
   Name  Cost Serial
0     A     1      a
1     A     2      b
2     A     3      c
3     A     4      d
4     B     5      e
5     B     6      f
6     B     7      g
7     B     8      h
8     C     9      i
9     C    10      j
10    C    11      k
11    C    12      l

另一种方式。

In [42]: pd.DataFrame({
            'Name': df.columns.repeat(len(df.index)), 
            'Cost': df.values.flatten(order='k'), 
            'Serial': df2.values.flatten(order='k')})
Out[42]:
    Cost Name Serial
0      1    A      a
1      2    A      b
2      3    A      c
3      4    A      d
4      5    B      e
5      6    B      f
6      7    B      g
7      8    B      h
8      9    C      i
9     10    C      j
10    11    C      k
11    12    C      l