我正在处理一个处理图像的程序,如果底层OCR检测到它们是颠倒的,可以翻转它们。
然而,就边界框而言,OCR输出并非100%可靠,因此有时会错误地检测到发票是颠倒的......永远。
我需要阻止这一点:文件在翻转后不再有唯一标识符,在翻转两次之后我再也看不到它们是同一个文件。
那么从BufferedImage
创建哈希的最佳或可接受的做法是什么。我假设每次读取相同的文件时,它都会为BufferedImage
中的每个像素生成相同的RGB值。
我自己可以实现一些天真算法,获取每个像素的RGB,然后计算哈希/校验和。但是我不相信这是一种正确的方法,最好怎么做呢?