使用read_json和read_sql_table时drop_duplicates

时间:2018-11-23 17:05:50

标签: python pandas

我希望比较两个DataFrame之间的重复项,我可以这样做:

@echo off
set Source=C:\csvtest
set Target=C:\csvtest\csvtest\Archive
FOR /f "tokens=1-8 delims=/.:- " %%A in ("%date%%time%") DO (
SET Month=%%B
SET Day=%%C
SET Year=%%D
SET Hours=%%E
SET Minutes=%%F
SET Seconds=%%G
SET All=%%B-%%C-%%D_%%E-%%F-%%G
)

FOR %%i IN ("%Source%\*.csv") DO (
COPY "%%i" "%Target%\%%~Ni %All%.csv")

我在实际的DataFrame中遇到问题,一个DataFrame来自pd.concat([df1, df2]).drop_duplicates(keep=False) ,另一个来自read_sql_table。似乎来自read_json的DataFrame包含一个索引,该索引在read_json DataFrame中不存在。如何在这两个数据框之间read_sql_table

0 个答案:

没有答案