我正在观察一些我打算按日期升序对数据框进行随机排序的结果。对于多次运行,大多数运行返回正确的结果,但对于少数运行,则返回错误的结果。
records_df = records_df.groupby(['YEAR','QUARTER','SUPPLIER_ID']).TRANSACTION_DATES.agg({'TRANSACTION_DATES' : lambda x: list(x.unique())}).reset_index()
# This now sorts in date order
records_df.sort_values(by=['TRANSACTION_DATES'])
对于大多数跑步: TRANSACTION_DATES:[17年9月5日,17年9月6日,17年9月7日]
对于某些运行:看到错误的结果:
TRANSACTION_DATES:[17年9月6日,17年9月7日,17年9月5日]
为什么会这样,因为我已经在使用sort_values强制执行排序了?