在python的pandas包中的以下示例中,当合并两个具有重复/公共索引的数据帧时,这些索引是 http://pandas.pydata.org/pandas-docs/dev/10min.html#join
是否可以像下面这样合并它:
key lval rval
0 foo 1,2 4,5
如果1,2,4,5是字符串,它会有所作为吗?
答案 0 :(得分:2)
我不建议使用这种数据结构,我预计有更好的方法取决于分析的下一阶段是什么......
说,这是一种方法。获取每个键的系列列表:
In [11]: l = left.groupby('key')['lval'].apply(list)
In [12]: l.name = 'lval'
In [13]: l
Out[13]:
key
foo [1, 2]
Name: lval, dtype: object
In [14]: r = right.groupby('key')['rval'].apply(list)
In [15]: r.name = 'rval'
然后将这些连接到DataFrame:
In [16]: pd.concat([l, r], axis=1)
Out[16]:
lval rval
key
foo [1, 2] [4, 5]