我有两个按日期编制索引的熊猫系列如下,pd_series中约有40m元素,而s1是pd_series的排序子数组,大约有20m个元素。我试图通过执行以下操作来避免对整个pd_series进行排序。
s1 = pd_dc_series
s2 = pd_series[dt_dc_end+2:dt_end]
s = pd.concat([s1, s2])
s.sort()
其中pd_dc_series和pd_series是pandas系列,dt_dc_end和dt_end是pandas.tslib.Timestamp对象,它们之间约有20m的日期。但是,s2 = pd_series[dt_dc_end+2:dt_end]
切片步骤需要6.29239106178秒。有没有办法大大加快这个速度?