计算dask数据框中的2个datetime列之间的天数

时间:2018-10-22 15:59:23

标签: python pandas datetime dataframe dask

我有一个dask数据框,其中包含两列,是字符串格式,就像这样

start_date  end_date
2018-09-01  2018-10-01
2018-09-02  2018-09-22
...

我想计算两列之间的天数。如果它是熊猫数据框,我可以这样做:

df["num_days"] = (df["end_day"]-df["start_date"]).apply(lambda s:s.total_seconds()/24/60/60)

但是在dask数据框中,这似乎不起作用。在这种情况下,要计算列之间的经过天数吗?

谢谢

1 个答案:

答案 0 :(得分:2)

dask.dataframe支持Pandas API的有用子集,包括Series.dt方法。因此,您可以直接使用此功能:

testcase['procurement_class0'] = y_pred1[:,0]
testcase['procurement_class1'] = y_pred1[:,1]
testcase['procurement_class2'] = y_pred1[:,2]