我创建了一个数据框'x'
我想创建另一个数据帧y,其中包含来自dataframe x的特征'wheat_type'的值
所以我执行了代码
y=X.loc[:, 'wheat_type']
当我运行以下命令时
y['wheat_type'] = y.wheat_type("category").cat.codes
我收到了以下错误
'系列'对象没有属性'wheat_type'
在执行类型(X)时,我得到了
<class 'pandas.core.frame.DataFrame'>
并且在执行类型(y)时,我得到了
<class 'pandas.core.series.Series'>
是否有可能将y转换为数据帧。如果没有,请告诉我如何从x创建所需的数据帧y
答案 0 :(得分:2)
X = pd.DataFrame({'wheat_type':[5,7,3]})
print (X)
wheat_type
0 5
1 7
2 3
#create DataFrame by subset
y=X[['wheat_type']]
#cast to category and get codes
y['wheat_type'] = y.wheat_type.astype("category").cat.codes
print (y)
wheat_type
0 1
1 2
2 0
如果有多列,最好使用to_frame
作为指向Ami
:
X = pd.DataFrame({'wheat_type':[5,7,3], 'z':[4,7,9]})
print (X)
wheat_type z
0 5 4
1 7 7
2 3 9
y = X['wheat_type'].to_frame()
#cast to category and get codes
y['wheat_type'] = y.wheat_type.astype("category").cat.codes
print (y)
wheat_type
0 1
1 2
2 0
创建新DataFrame的另一个解决方案是子集和copy
:
y = X[['wheat_type']].copy()
答案 1 :(得分:1)
有一种特殊方法 - pd.Series.to_frame
In [2]: df = pd.DataFrame({'a': range(4)})
In [3]: df.a
Out[3]:
0 0
1 1
2 2
3 3
Name: a, dtype: int64
In [4]: df.a.to_frame()
Out[4]:
a
0 0
1 1
2 2
3 3