我正在使用以下pandas数据框,其中包含一个包含日期作为字符串的列。日期也有时间。
(Pdb) temp_df_no_na['logged_dt'].head(n=5)
0 01/19/2010 00:00:00.000000
1 03/28/2009 00:00:00.000000
2 09/22/2005 00:00:00.000000
3 12/14/2010 00:00:00.000000
5 02/23/2010 00:00:00.000000
我希望按当时日期之间的间距进行拆分,并仅保留日期部分。
我写了下面的lambda函数并做了一个申请。它确实有效,但最终得到警告,我担心结果可能会腐败。为什么我会收到这样的警告:
temp_df_no_na['logged_dt'] = temp_df_no_na['logged_dt'].apply(lambda x:x.split(" ")[0] if(x.split(" ") > 0) else x)
这是警告
SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
from dataFrameCreator import DataFrameCreator
(Pdb) temp_df_no_na['logged_dt'].head(n=5)
0 01/19/2010
1 03/28/2009
2 09/22/2005
3 12/14/2010
5 02/23/2010
答案 0 :(得分:2)
方法1
使用pd.to_datetime获取Timestamp
temp_df_no_na.logged_dt = pd.to_datetime(temp_df_no_na.logged_dt)
temp_df_no_na.logged_dt
0 2010-01-19
1 2009-03-28
2 2005-09-22
3 2010-12-14
5 2010-02-23
Name: logged_dt, dtype: datetime64[ns]
方法2
dt.strftime
temp_df_no_na.logged_dt = pd.to_datetime(temp_df_no_na.logged_dt).dt.strftime('%Y-%m-%d')
temp_df_no_na.logged_dt
0 2010-01-19
1 2009-03-28
2 2005-09-22
3 2010-12-14
5 2010-02-23
Name: logged_dt, dtype: object
mehtod 3
str.split
temp_df_no_na.logged_dt = temp_df_no_na.logged_dt.str.split().str[0]
temp_df_no_na.logged_dt
0 2010-01-19
1 2009-03-28
2 2005-09-22
3 2010-12-14
5 2010-02-23
Name: logged_dt, dtype: object