合并具有重复索引的数据帧

时间:2013-09-22 02:24:51

标签: python pandas

在python的pandas包中的以下示例中,当合并两个具有重复/公共索引的数据帧时,这些索引是 http://pandas.pydata.org/pandas-docs/dev/10min.html#join

是否可以像下面这样合并它:

     key  lval    rval
  0  foo     1,2     4,5

如果1,2,4,5是字符串,它会有所作为吗?

1 个答案:

答案 0 :(得分:2)

我不建议使用这种数据结构,我预计有更好的方法取决于分析的下一阶段是什么......

说,这是一种方法。获取每个键的系列列表:

In [11]: l = left.groupby('key')['lval'].apply(list)

In [12]: l.name = 'lval'

In [13]: l
Out[13]:
key
foo    [1, 2]
Name: lval, dtype: object

In [14]: r = right.groupby('key')['rval'].apply(list)

In [15]: r.name = 'rval'

然后将这些连接到DataFrame:

In [16]: pd.concat([l, r], axis=1)
Out[16]:
       lval    rval
key
foo  [1, 2]  [4, 5]