Question

所以我有一个系列列表，如下：

groupdf1
Out[304]: 
[90-95    9
 >100     1
 80-90    1
 50-80    1
 Name: bucket, dtype: int64, 80-90     9
 95-100    1
 90-95     1
 50-80     1
 Name: bucket, dtype: int64, 80-90    10
 90-95     1
 50-80     1
 Name: bucket, dtype: int64, 80-90     11
 95-100     1
 Name: bucket, dtype: int64, 50-80    9

我正在尝试创建如下数据框：

      bucket.1  bucket.2 bucket.3 bucket.4
90-95   9         1         1        NaN
>100    1        NaN       NaN       NaN
80-90   1         9        10        11
50-80   1         1         1        NaN
95-100 NaN       NaN       NaN        1

基本上是将每个系列合并到索引上。我无法循环运行它。我收到以下错误：

groupdf=pd.DataFrame(groupdf1[0])
for i in range(1,len(groupdf1)):
    groupdf2=pd.DataFrame(groupdf1[i])
    groupdf.concat(groupdf2)


Traceback (most recent call last):

  File "<ipython-input-278-4c8876ecdb74>", line 4, in <module>
    groupdf.concat(groupdf2)

  File "C:\Users\hp1\Anaconda3\lib\site-packages\pandas\core\generic.py", line 3081, in __getattr__
    return object.__getattribute__(self, name)

AttributeError: 'DataFrame' object has no attribute 'concat'

有人可以在这里帮我吗？谢谢。

Answer 1

如果groupdf1是DataFrame的列表，请使用pandas.concat和axis=1，然后用enumerate和f-string设置新的列名：

df = pd.concat(groupdf1, axis=1)
df.columns = [f'{x}.{i}' for i, x in enumerate(df.columns, 1)]
#alternative
#df.columns = [f'bucket.{i}' for i in np.arange(1,len(df.columns) + 1)]

Answer 2

它是pandas.concat ... DataFrame对象没有该属性。尝试pandas.concat（（df1，df2））或任何您命名的数据框。正如jezrael指出的那样，pd.concat占用数据帧的任何间隔，因此只需将axis = 1参数传递即可进行逐列连接。

在熊猫中循环合并多个系列

2 个答案: