所以我有一个系列列表,如下:
groupdf1
Out[304]:
[90-95 9
>100 1
80-90 1
50-80 1
Name: bucket, dtype: int64, 80-90 9
95-100 1
90-95 1
50-80 1
Name: bucket, dtype: int64, 80-90 10
90-95 1
50-80 1
Name: bucket, dtype: int64, 80-90 11
95-100 1
Name: bucket, dtype: int64, 50-80 9
我正在尝试创建如下数据框:
bucket.1 bucket.2 bucket.3 bucket.4
90-95 9 1 1 NaN
>100 1 NaN NaN NaN
80-90 1 9 10 11
50-80 1 1 1 NaN
95-100 NaN NaN NaN 1
基本上是将每个系列合并到索引上。我无法循环运行它。我收到以下错误:
groupdf=pd.DataFrame(groupdf1[0])
for i in range(1,len(groupdf1)):
groupdf2=pd.DataFrame(groupdf1[i])
groupdf.concat(groupdf2)
Traceback (most recent call last):
File "<ipython-input-278-4c8876ecdb74>", line 4, in <module>
groupdf.concat(groupdf2)
File "C:\Users\hp1\Anaconda3\lib\site-packages\pandas\core\generic.py", line 3081, in __getattr__
return object.__getattribute__(self, name)
AttributeError: 'DataFrame' object has no attribute 'concat'
有人可以在这里帮我吗?谢谢。
答案 0 :(得分:3)
如果groupdf1
是DataFrame
的列表,请使用pandas.concat
和axis=1
,然后用enumerate
和f-string
设置新的列名:
df = pd.concat(groupdf1, axis=1)
df.columns = [f'{x}.{i}' for i, x in enumerate(df.columns, 1)]
#alternative
#df.columns = [f'bucket.{i}' for i in np.arange(1,len(df.columns) + 1)]
答案 1 :(得分:1)
它是pandas.concat ... DataFrame对象没有该属性。尝试pandas.concat((df1,df2))或任何您命名的数据框。正如jezrael指出的那样,pd.concat占用数据帧的任何间隔,因此只需将axis = 1参数传递即可进行逐列连接。