Pandas拆分列值并分配回列

时间:2016-11-10 20:36:13

标签: python pandas

我正在使用以下pandas数据框,其中包含一个包含日期作为字符串的列。日期也有时间。

(Pdb) temp_df_no_na['logged_dt'].head(n=5)
0    01/19/2010 00:00:00.000000
1    03/28/2009 00:00:00.000000
2    09/22/2005 00:00:00.000000
3    12/14/2010 00:00:00.000000
5    02/23/2010 00:00:00.000000

我希望按当时日期之间的间距进行拆分,并仅保留日期部分。

我写了下面的lambda函数并做了一个申请。它确实有效,但最终得到警告,我担心结果可能会腐败。为什么我会收到这样的警告:

temp_df_no_na['logged_dt'] =  temp_df_no_na['logged_dt'].apply(lambda x:x.split(" ")[0] if(x.split(" ") > 0) else x)

这是警告

SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  from dataFrameCreator import DataFrameCreator

(Pdb) temp_df_no_na['logged_dt'].head(n=5)
0    01/19/2010
1    03/28/2009
2    09/22/2005
3    12/14/2010
5    02/23/2010

1 个答案:

答案 0 :(得分:2)

方法1
使用pd.to_datetime获取Timestamp

temp_df_no_na.logged_dt = pd.to_datetime(temp_df_no_na.logged_dt)
temp_df_no_na.logged_dt

0   2010-01-19
1   2009-03-28
2   2005-09-22
3   2010-12-14
5   2010-02-23
Name: logged_dt, dtype: datetime64[ns]

方法2
dt.strftime

temp_df_no_na.logged_dt = pd.to_datetime(temp_df_no_na.logged_dt).dt.strftime('%Y-%m-%d')
temp_df_no_na.logged_dt

0   2010-01-19
1   2009-03-28
2   2005-09-22
3   2010-12-14
5   2010-02-23
Name: logged_dt, dtype: object

mehtod 3
str.split

temp_df_no_na.logged_dt = temp_df_no_na.logged_dt.str.split().str[0]
temp_df_no_na.logged_dt

0   2010-01-19
1   2009-03-28
2   2005-09-22
3   2010-12-14
5   2010-02-23
Name: logged_dt, dtype: object