在熊猫中循环合并多个系列

时间:2018-10-02 07:38:56

标签: python pandas loops merge series

所以我有一个系列列表,如下:

groupdf1
Out[304]: 
[90-95    9
 >100     1
 80-90    1
 50-80    1
 Name: bucket, dtype: int64, 80-90     9
 95-100    1
 90-95     1
 50-80     1
 Name: bucket, dtype: int64, 80-90    10
 90-95     1
 50-80     1
 Name: bucket, dtype: int64, 80-90     11
 95-100     1
 Name: bucket, dtype: int64, 50-80    9

我正在尝试创建如下数据框:

      bucket.1  bucket.2 bucket.3 bucket.4
90-95   9         1         1        NaN
>100    1        NaN       NaN       NaN
80-90   1         9        10        11
50-80   1         1         1        NaN
95-100 NaN       NaN       NaN        1

基本上是将每个系列合并到索引上。我无法循环运行它。我收到以下错误:

groupdf=pd.DataFrame(groupdf1[0])
for i in range(1,len(groupdf1)):
    groupdf2=pd.DataFrame(groupdf1[i])
    groupdf.concat(groupdf2)


Traceback (most recent call last):

  File "<ipython-input-278-4c8876ecdb74>", line 4, in <module>
    groupdf.concat(groupdf2)

  File "C:\Users\hp1\Anaconda3\lib\site-packages\pandas\core\generic.py", line 3081, in __getattr__
    return object.__getattribute__(self, name)

AttributeError: 'DataFrame' object has no attribute 'concat'

有人可以在这里帮我吗?谢谢。

2 个答案:

答案 0 :(得分:3)

如果groupdf1DataFrame的列表,请使用pandas.concataxis=1,然后用enumeratef-string设置新的列名:

df = pd.concat(groupdf1, axis=1)
df.columns = [f'{x}.{i}' for i, x in enumerate(df.columns, 1)]
#alternative
#df.columns = [f'bucket.{i}' for i in np.arange(1,len(df.columns) + 1)]

答案 1 :(得分:1)

它是pandas.concat ... DataFrame对象没有该属性。尝试pandas.concat((df1,df2))或任何您命名的数据框。正如jezrael指出的那样,pd.concat占用数据帧的任何间隔,因此只需将axis = 1参数传递即可进行逐列连接。