如何将pandas DataFrame的第一列作为一个系列?

时间:2013-03-12 12:14:22

标签: python dataframe pandas series

我试过了:

x=pandas.DataFrame(...)
s = x.take([0], axis=1)

s获取数据框,而不是系列。

6 个答案:

答案 0 :(得分:108)

>>> import pandas as pd
>>> df = pd.DataFrame({'x' : [1, 2, 3, 4], 'y' : [4, 5, 6, 7]})
>>> df
   x  y
0  1  4
1  2  5
2  3  6
3  4  7
>>> s = df.ix[:,0]
>>> type(s)
<class 'pandas.core.series.Series'>
>>>

=============================================== ============================

<强>更新

如果您在2017年6月之后阅读此内容,则在pandas 0.20.2中已弃用ix,因此请勿使用它。请改用lociloc。请参阅此问题的评论和其他答案。

答案 1 :(得分:92)

您可以通过以下代码获得第一列作为系列:

x[x.columns[0]]

答案 2 :(得分:74)

从v0.11 +,...使用df.iloc

In [7]: df.iloc[:,0]
Out[7]: 
0    1
1    2
2    3
3    4
Name: x, dtype: int64

答案 3 :(得分:11)

这不是最简单的方法吗?

按列名:

In [20]: df = pd.DataFrame({'x' : [1, 2, 3, 4], 'y' : [4, 5, 6, 7]})
In [21]: df
Out[21]:
    x   y
0   1   4
1   2   5
2   3   6
3   4   7

In [23]: df.x
Out[23]:
0    1
1    2
2    3
3    4
Name: x, dtype: int64

In [24]: type(df.x)
Out[24]:
pandas.core.series.Series

答案 4 :(得分:2)

df[df.columns[i]]

其中i是列的位置/编号(从 0 开始)。

因此,i = 0是第一列。

您还可以使用i = -1

获取最后一列

答案 5 :(得分:0)

当您想从csv文件

加载系列时,这非常有用
x = pd.read_csv('x.csv', index_col=False, names=['x'],header=None).iloc[:,0]
print(type(x))
print(x.head(10))


<class 'pandas.core.series.Series'>
0    110.96
1    119.40
2    135.89
3    152.32
4    192.91
5    177.20
6    181.16
7    177.30
8    200.13
9    235.41
Name: x, dtype: float64