我正在寻找一种方法,以编程方式识别图像是否可能是照片与插图/徽标/图表。图像总是JPEG格式,所以我不能使用它自己的格式元数据来区分(我也看过使用尺寸但是没有帮助在这个场景中,我们处理的是相似的比例,它们通常也会被剥夺相机元数据。
具体来说,我想要一种方法来筛选出我所遇到的< 10%不是照片的图像,尽管这种方法并不需要完全证明(如果它可以工作~10次中有9次,与无所事事相比,这将是一个重大进步。
我不介意解决方案使用的编程语言或平台。理想的是能够使用现有的高级库或易于实现的(即尽可能少的LoC);可以用多种语言复制的低级方法。我还要感谢被指向开源项目的例子,即使他们做的事情很糟糕。
我没有很大的运气来寻找这样做的技巧。我注意到许多搜索引擎在搜索图像时提供了这个选项,并取得了不同程度的成功。
注意:我从各种来源获取现有图片,这是为了R& D目的,并符合当地版权法(在任何人要求之前)。
如果没有任何库可以做到这一点,我可能最终写一个(可能根据最大的独特颜色,固体颜色块等估计概率),但我希望有人发布了可用的东西已经这样了,我还没有找到它!
答案 0 :(得分:1)
继Maurits在上面的第二条评论中提出的建议之后,我查看了Hany Farid's site,这引出了我与之相关的一些内容。
看看这项服务,它可能会有所帮助。
根据他们的网站,他们描述了一个服务/工具,可以分析文件以确定文件是否是原始照片的可能性。返回的结果是他们所谓的“信任评级”。
他们似乎有API来处理JPEG文件
希望这有帮助。
干杯, 丹