python - 使用read_json和read_sql_table时drop_duplicates

我希望比较两个DataFrame之间的重复项，我可以这样做：

@echo off
set Source=C:\csvtest
set Target=C:\csvtest\csvtest\Archive
FOR /f "tokens=1-8 delims=/.:- " %%A in ("%date%%time%") DO (
SET Month=%%B
SET Day=%%C
SET Year=%%D
SET Hours=%%E
SET Minutes=%%F
SET Seconds=%%G
SET All=%%B-%%C-%%D_%%E-%%F-%%G
)

FOR %%i IN ("%Source%\*.csv") DO (
COPY "%%i" "%Target%\%%~Ni %All%.csv")

我在实际的DataFrame中遇到问题，一个DataFrame来自pd.concat([df1, df2]).drop_duplicates(keep=False)，另一个来自read_sql_table。似乎来自read_json的DataFrame包含一个索引，该索引在read_json DataFrame中不存在。如何在这两个数据框之间read_sql_table？

使用read_json和read_sql_table时drop_duplicates

0 个答案: