用pd.to_datetime警告pandas

时间:2016-03-22 13:44:52

标签: python pandas

使用pandas 0.6.2。我想将数据框更改为datetime类型,这里是数据框

>>> tt.head()
0    2015-02-01 00:46:28
1    2015-02-01 00:59:56
2    2015-02-01 00:16:27
3    2015-02-01 00:33:45
4    2015-02-01 13:48:29
Name: TS, dtype: object

我希望将tt中的每个项目更改为datetime类型,然后获取hour。代码是

for i in tt.index:
   tt[i]=pd.to_datetime(tt[i])

和waring是

__main__:2: SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame

See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy

为什么会出现警告,我该如何处理?

如果我每次更改一个项目,它都可以,代码是

>>> tt[1]=pd.to_datetime(tt[1])
>>> tt[1].hour
0

1 个答案:

答案 0 :(得分:1)

只需在整个Series上执行,因为to_datetime可以对类似数组的args进行操作并直接指向列:

In [72]:
df['date'] = pd.to_datetime(df['date'])
df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 5 entries, 0 to 4
Data columns (total 1 columns):
date    5 non-null datetime64[ns]
dtypes: datetime64[ns](1)
memory usage: 80.0 bytes

In [73]:
df

Out[73]:
                     date
index                    
0     2015-02-01 00:46:28
1     2015-02-01 00:59:56
2     2015-02-01 00:16:27
3     2015-02-01 00:33:45
4     2015-02-01 13:48:29

如果您将循环更改为此,那么它将起作用:

In [80]:
for i in df.index:
    df.loc[i,'date']=pd.to_datetime(df.loc[i, 'date'])
df

Out[80]:
                      date
index                     
0      2015-02-01 00:46:28
1      2015-02-01 00:59:56
2      2015-02-01 00:16:27
3      2015-02-01 00:33:45
4      2015-02-01 13:48:29

代码呻吟,因为您可能在df而不是视图上操作该行的副本,使用新的indexers可以避免这种歧义

修改

看起来你正在使用古老版本的熊猫,以下应该有效:

tt[1].apply(lambda x: x.hour)