我导入了超过500k行的CSV文件,每年一分钟。 要合并其中两个文件,我希望每分钟重新采样索引:
Temp= pd.read_csv("Temp.csv", sep=";", decimal="," , thousands='.' ,encoding="cp1252")
Temp["Time"] = pd.to_datetime(Temp["Time"],dayfirst=True)
Temp.set_index(['Time'], inplace=True)
Temp= Temp.resample('1Min').ffill()
但是我得到了错误:
无法使用方法或限制
重新索引非唯一索引
我怎样才能找到"非独特的"行?
答案 0 :(得分:0)
我的解决方案:
Temp= pd.read_csv("Temp.csv", sep=";", decimal="," , thousands='.' ,encoding="cp1252")
Temp.drop_duplicates(inplace=True)
Temp["Time"] = pd.to_datetime(Temp["Time"],dayfirst=True)
Temp.set_index(['Time'], inplace=True)
Temp= Temp.resample('1Min').ffill()
我用过:
len(Temp.index)
和
len(set(Temp.index))
发现,有共和党