我有一个dask数据框,其中包含两列,是字符串格式,就像这样
start_date end_date
2018-09-01 2018-10-01
2018-09-02 2018-09-22
...
我想计算两列之间的天数。如果它是熊猫数据框,我可以这样做:
df["num_days"] = (df["end_day"]-df["start_date"]).apply(lambda s:s.total_seconds()/24/60/60)
但是在dask数据框中,这似乎不起作用。在这种情况下,要计算列之间的经过天数吗?
谢谢
答案 0 :(得分:2)
dask.dataframe
支持Pandas API的有用子集,包括Series.dt
方法。因此,您可以直接使用此功能:
testcase['procurement_class0'] = y_pred1[:,0]
testcase['procurement_class1'] = y_pred1[:,1]
testcase['procurement_class2'] = y_pred1[:,2]