我的代码类似于:
df = raw_report[some_columns].copy()
df.drop_duplicates(inplace=True)
我使用copy()
来避免关于查看/复制的不确定性的警告。但是,我想使用一个视图,因为后来我只读了这个DataFrame
。生成警告的行是删除重复项的行,因此我假设它不生成视图。
因此,我的问题是:有没有办法从视图中删除重复项?或者,有没有办法优化视图,使其不包含重复项?
答案 0 :(得分:0)
我认为只需要DataFrame.drop_duplicates
中的某些列来删除重复项的参数子集:
raw_report.drop_duplicates(subset=[some_columns],inplace=True)