我使用Request将图像管道传输到本地文件系统,并尝试通过散列接收到的缓冲区来识别重复项。但是,当我尝试管道重复的图像时,接收到的缓冲区由于某种原因每次都会略有不同,更改了1-2个字节(数十万个)。然而,即使只是一个字节的差异就足以让我的哈希出来完全不同而不是将图像标记为重复它应该是什么 - 我怎么能避免这种情况呢?
谢谢!
答案 0 :(得分:0)
你做不到。根据设计,散列函数将为不同的输入提供不同的结果。
听起来好像你正在尝试检测类似的图像,这是一个相当不同且非常困难的问题。有关感知图像散列的信息,请搜索文献以获取更多信息。