使用pandas 0.6.2
。我想将数据框更改为datetime
类型,这里是数据框
>>> tt.head()
0 2015-02-01 00:46:28
1 2015-02-01 00:59:56
2 2015-02-01 00:16:27
3 2015-02-01 00:33:45
4 2015-02-01 13:48:29
Name: TS, dtype: object
我希望将tt
中的每个项目更改为datetime
类型,然后获取hour
。代码是
for i in tt.index:
tt[i]=pd.to_datetime(tt[i])
和waring是
__main__:2: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
为什么会出现警告,我该如何处理?
如果我每次更改一个项目,它都可以,代码是
>>> tt[1]=pd.to_datetime(tt[1])
>>> tt[1].hour
0
答案 0 :(得分:1)
只需在整个Series
上执行,因为to_datetime
可以对类似数组的args进行操作并直接指向列:
In [72]:
df['date'] = pd.to_datetime(df['date'])
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 5 entries, 0 to 4
Data columns (total 1 columns):
date 5 non-null datetime64[ns]
dtypes: datetime64[ns](1)
memory usage: 80.0 bytes
In [73]:
df
Out[73]:
date
index
0 2015-02-01 00:46:28
1 2015-02-01 00:59:56
2 2015-02-01 00:16:27
3 2015-02-01 00:33:45
4 2015-02-01 13:48:29
如果您将循环更改为此,那么它将起作用:
In [80]:
for i in df.index:
df.loc[i,'date']=pd.to_datetime(df.loc[i, 'date'])
df
Out[80]:
date
index
0 2015-02-01 00:46:28
1 2015-02-01 00:59:56
2 2015-02-01 00:16:27
3 2015-02-01 00:33:45
4 2015-02-01 13:48:29
代码呻吟,因为您可能在df而不是视图上操作该行的副本,使用新的indexers可以避免这种歧义
修改强>
看起来你正在使用古老版本的熊猫,以下应该有效:
tt[1].apply(lambda x: x.hour)