我有一个类似这样的数据框:
PatientID Date
1 01/01/2011
3 03/03/2012
3 15/01/2015
1 01/01/2011
我希望找到每个PatientID的最短日期,这个:
我正在做以下事情:
min_date = patient_df.groupby("PatientID", as_index=False)["Date"].min()
这似乎有效,但对于PatientID == 1
,它会返回NaN
。这是因为所有相关行的PatientID == 1
日期相同吗?
如果您比较两个值并且它们是相同的,那么为什么它不会将该值作为最小值返回,因为没有值更低?
对这位新手的帮助将不胜感激。
谢谢
答案 0 :(得分:0)