将Series转换为DataFrame

时间:2016-08-12 08:28:32

标签: python pandas dataframe series categorical-data

我创建了一个数据框'x'

我想创建另一个数据帧y,其中包含来自dataframe x的特征'wheat_type'的值

所以我执行了代码

y=X.loc[:, 'wheat_type']

当我运行以下命令时

y['wheat_type'] = y.wheat_type("category").cat.codes

我收到了以下错误

  

'系列'对象没有属性'wheat_type'

在执行类型(X)时,我得到了

 <class 'pandas.core.frame.DataFrame'>

并且在执行类型(y)时,我得到了

 <class 'pandas.core.series.Series'>

是否有可能将y转换为数据帧。如果没有,请告诉我如何从x创建所需的数据帧y

2 个答案:

答案 0 :(得分:2)

看起来需要astypeto_frame

X = pd.DataFrame({'wheat_type':[5,7,3]})
print (X)
   wheat_type
0           5
1           7
2           3

#create DataFrame by subset
y=X[['wheat_type']]

#cast to category and get codes
y['wheat_type'] = y.wheat_type.astype("category").cat.codes
print (y)
   wheat_type
0           1
1           2
2           0

如果有多列,最好使用to_frame作为指向Ami

X = pd.DataFrame({'wheat_type':[5,7,3], 'z':[4,7,9]})
print (X)
   wheat_type  z
0           5  4
1           7  7
2           3  9

y = X['wheat_type'].to_frame()

#cast to category and get codes
y['wheat_type'] = y.wheat_type.astype("category").cat.codes
print (y)
   wheat_type
0           1
1           2
2           0

创建新DataFrame的另一个解决方案是子集和copy

y = X[['wheat_type']].copy()

答案 1 :(得分:1)

有一种特殊方法 - pd.Series.to_frame

In [2]: df = pd.DataFrame({'a': range(4)})

In [3]: df.a
Out[3]: 
0    0
1    1
2    2
3    3
Name: a, dtype: int64

In [4]: df.a.to_frame()
Out[4]: 
   a
0  0
1  1
2  2
3  3