我今天大部分时间都在尝试寻找某种功能来为已知图像生成密钥,以便稍后进行比较以确定图像是什么。我试图使用SIFT和SURF描述符,这两种描述符都太慢(并且专利用于商业用途)。我最近的尝试是使用:
创建一个dct哈希 int mm_dct_imagehash(const char* file, float sigma, uint64_t *hash){
if (!file) return -1;
if (!hash) return -2;
*hash = 0;
IplImage *img = cvLoadImage(file, CV_LOAD_IMAGE_GRAYSCALE);
if (!img) return -3;
cvSmooth(img, img, CV_GAUSSIAN, 7, 7, sigma, sigma);
IplImage *img_resized = cvCreateImage(cvSize(32,32), img->depth, img->nChannels);
if (!img_resized) return -4;
cvResize(img, img_resized, CV_INTER_CUBIC);
IplImage *img_prime = cvCreateImage(cvSize(32,32), IPL_DEPTH_32F, img->nChannels);
if (!img_prime) return -5;
cvConvertScale(img_resized, img_prime,1, 0);
IplImage *dct_img = cvCreateImage(cvSize(32,32), IPL_DEPTH_32F, img->nChannels);
if (!dct_img) return -6;
cvDCT(img_prime, dct_img, CV_DXT_FORWARD);
cvSetImageROI(dct_img, cvRect(1,1,8,8));
double minval, maxval;
cvMinMaxLoc(dct_img, &minval, &maxval, NULL, NULL, NULL);
double medval = (maxval + minval)/2;
int i,j;
for (i=1;i<=8;i++){
const float *row = (const float*)(dct_img->imageData + i*dct_img->widthStep);
for (j=1;j<=8;j++){
if (row[j] > medval){
(*hash) |= 1;
}
(*hash) <<= 1;
}
}
cvReleaseImage(&img);
cvReleaseImage(&img_resized);
cvReleaseImage(&img_prime);
cvReleaseImage(&dct_img);
return 0;
}
这确实产生了我正在寻找的类型,但是当我尝试将它与已知哈希的数据库进行比较时,我得到的积极因素与我的积极因素一样多。所以,我回过头来想,我可能会问专家。
你们中的任何人都知道/有一个功能可以为我提供某种标识符/校验和提供的图像,这些功能在类似的图像中保持相似,因此可以通过与数据库的比较来快速识别图像吗?简而言之,图像最适合哪种校验和?
我不是在寻找理论,概念,论文或想法,而是寻找有效的解决方案。我不会再花一天时间去寻找死胡同,并且感谢任何花时间整理代码的人。
通过更多研究,我知道autoit devs设计了pixelchecksum来使用“Adler-32”算法。我想下一步是找到一个c实现并让它来处理像素数据。欢迎任何建议!
答案 0 :(得分:0)
答案 1 :(得分:0)
简短的回答是,您的问题没有开箱即用的解决方案。此外,Adler-32算法无法解决您的问题。
不幸的是,使用图像签名(或相关概念)通过视觉相似性比较图像是一个非常活跃和开放的研究课题。例如,你说你的测试中有很多误报。但是,正确或错误的结果是主观的,取决于您的申请。
在我看来,解决问题的唯一方法是找到适合您问题的图像描述符,然后用它来比较图像。请注意,比较从图像中提取的描述符并非易事。