我正在尝试查找文件夹中重复图像的数量。我想打印带有计数的唯一图像(它有多少重复)。我该怎么做? 我现在的代码:
for i in image_path_list:
image2 = cv2.imread(i)
image2 = cv2.resize(image2,(360,480))
for j in image_path_list:
if i!=j:
image1=cv2.imread(j)
image1=cv2.resize(image1, (360,480))
difference = cv2.subtract(image1, image2)
result = not np.any(difference) #if difference is all zeros it will return False
if result is True:
print(i)
else:
continue
答案 0 :(得分:1)
您可以使用HASH来检查文件是否已经在该目录中。
为每个文件生成一个哈希,将其写入数组/数据库,然后检查每个文件的哈希是否已在该目录中-如果是,则将其删除/ count + = 1。
也:
https://github.com/philipbl/duplicate-images