pandas.Series()使用DataFrame Columns创建返回NaN数据条目

时间:2016-03-05 19:35:48

标签: python python-3.x pandas dataframe time-series

我尝试使用简化的代码将数据帧转换为系列,如下所示:

dates = ['2016-1-{}'.format(i)for i in range(1,21)]
values = [i for i in range(20)]
data = {'Date': dates, 'Value': values}
df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date'])
ts = pd.Series(df['Value'], index=df['Date'])
print(ts)

但是,打印输出如下所示:

Date
2016-01-01   NaN
2016-01-02   NaN
2016-01-03   NaN
2016-01-04   NaN
2016-01-05   NaN
2016-01-06   NaN
2016-01-07   NaN
2016-01-08   NaN
2016-01-09   NaN
2016-01-10   NaN
2016-01-11   NaN
2016-01-12   NaN
2016-01-13   NaN
2016-01-14   NaN
2016-01-15   NaN
2016-01-16   NaN
2016-01-17   NaN
2016-01-18   NaN
2016-01-19   NaN
2016-01-20   NaN
Name: Value, dtype: float64

NaN来自哪里? DataFrame对象上的视图不是Series类的有效输入吗?

pd.Index个对象

I have found the to_series functionDataFrame s有类似内容吗?

3 个答案:

答案 0 :(得分:15)

我认为您可以使用values,将列Value转换为数组:

ts = pd.Series(df['Value'].values, index=df['Date'])
import pandas as pd
import numpy as np
import io

dates = ['2016-1-{}'.format(i)for i in range(1,21)]
values = [i for i in range(20)]
data = {'Date': dates, 'Value': values}
df = pd.DataFrame(data)
df['Date'] = pd.to_datetime(df['Date'])
print df['Value'].values
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19]

ts = pd.Series(df['Value'].values, index=df['Date'])
print(ts)
Date
2016-01-01     0
2016-01-02     1
2016-01-03     2
2016-01-04     3
2016-01-05     4
2016-01-06     5
2016-01-07     6
2016-01-08     7
2016-01-09     8
2016-01-10     9
2016-01-11    10
2016-01-12    11
2016-01-13    12
2016-01-14    13
2016-01-15    14
2016-01-16    15
2016-01-17    16
2016-01-18    17
2016-01-19    18
2016-01-20    19
dtype: int64

或者您可以使用:

ts1 = pd.Series(data=values, index=pd.to_datetime(dates))
print(ts1)
2016-01-01     0
2016-01-02     1
2016-01-03     2
2016-01-04     3
2016-01-05     4
2016-01-06     5
2016-01-07     6
2016-01-08     7
2016-01-09     8
2016-01-10     9
2016-01-11    10
2016-01-12    11
2016-01-13    12
2016-01-14    13
2016-01-15    14
2016-01-16    15
2016-01-17    16
2016-01-18    17
2016-01-19    18
2016-01-20    19
dtype: int64

感谢您@ajcr更好地解释为何获得NaN

当您向Series提供DataFramepd.Series列时,它会使用您指定的index对其进行重新索引。由于您的DataFrame列包含整数index(而不是date index),因此您会获得大量缺失值。

答案 1 :(得分:0)

如果您只是想要创建具有这些值的系列,您也可以这样做:

 

答案 2 :(得分:0)

你可以这样做:

s = df.set_index('Date')

现在是一列数据框。

如果你真的想要它作为一个系列:

s = df.set_index('Date').Value

顺便说一下,NaN是numpy的非数字。

使用您的方法,您可以使用:

ts = pd.Series(df['Value'].values, name='Value', index=df['Date'])

您获得NaN的原因是您没有以正确的格式提供数据。您正在将系列传递给系列。