我使用wget下载过去半小时内已更改的ZIP文件。 Zip文件有一个csv文件。 Zip文件可能有新的csv文件/修改过我已下载/未修改特定文件的文件。我需要从zip文件中选择这些修改过的文件/新文件并加载到数据库。如果您有任何建议,可以告诉我吗?
答案 0 :(得分:1)
您可以获得档案成员的CRC并按CRC进行比较
import zipfile
z = zipfile.ZipFile('d:\\temp\\debug.zip')
for member_info in z.infolist():
print member_info.orig_filename, member_info.CRC
out example(name,CRC):
tfr/products/tests/11/data/1000sites 1458294800
tfr/products/tests/11/data/100sites 1275729396
tfr/products/tests/11/data/list_of_2.txt 677585194
tfr/products/tests/11/data/list_of_1.txt 0