文件夹逻辑中的重复图像

时间:2018-09-20 07:29:47

标签: python python-3.x opencv opencv3.0

我正在尝试查找文件夹中重复图像的数量。我想打印带有计数的唯一图像(它有多少重复)。我该怎么做? 我现在的代码:

for i in image_path_list:
image2 = cv2.imread(i)
image2 = cv2.resize(image2,(360,480))
for j in image_path_list:
    if i!=j:
        image1=cv2.imread(j)
        image1=cv2.resize(image1, (360,480))
        difference = cv2.subtract(image1, image2)

        result = not np.any(difference) #if difference is all zeros it will return False

        if result is True:

            print(i)
        else:

            continue

1 个答案:

答案 0 :(得分:1)

您可以使用HASH来检查文件是否已经在该目录中。

为每个文件生成一个哈希,将其写入数组/数据库,然后检查每个文件的哈希是否已在该目录中-如果是,则将其删除/ count + = 1。

也:

https://github.com/philipbl/duplicate-images