按相关性排序图像的算法

时间:2010-06-26 17:11:16

标签: php sorting image

我正在论坛网站上开发一项功能,允许在帖子中包含链接和其他类型的内容(用于澄清问题或答案)。

与链接功能实现相关,我有几件事要处理:

  1. 验证输入的URI(格式正确,有效的方案等)
  2. 验证远程资源是否存在
  3. 从远程页面中提取图像
  4. 向用户显示图像集,让他选择一个
  5. 接下来是挑战。在步骤4之前,按照“相关性”的顺序对这组图像进行排序会很棒。我知道这是一个非常模糊的目标:-)但是我可以用步骤4中给出的结果解释我所经历的内容,你会知道我为什么要处理这个解决方案。

    很多时候,我将这类内容纳入图像集中:

    • 用于页面布局的图像(微小且无用)
    • 横幅和广告
    • 图像的伪复制(原始图像和调整大小的图像)
    • 集合的无序顺序(最后位置上的标识等)

    我决定清除这些乱七八糟的图像并按尺寸排序,但我知道这将远离一个好的解决方案。

    关于那个???的任何想法

    非常感谢!

2 个答案:

答案 0 :(得分:2)

您可以按饱和度排序(这可以很好地指示图像的有趣程度),查看Image Classification - Detecting Floor Plans的问题“sample implementation”。

最困难的是将图片广告与常规图片分开(因为它们的设计看起来非常有趣),为此,我建议使用以下一种或多种可能的解决方案:

  • 忽略具有广告标准尺寸的图片
  • 查询该网页两次并忽略更改的图片(广告往往是动态的)
  • 忽略托管在外部网站上的图片(了解CDN!)或特定的广告投放网址

为了克服分辨率中图像重复的问题,您可以将它们全部调整为非常低的分辨率(如8x8或4x4),如果两个或多个图像相同,则忽略小(呃)图像。

答案 1 :(得分:0)

您可能还希望按照托管位置对图像进行排序 - 首先是现场托管图像,然后是场外图像。如今,大多数广告图像都是从第三方服务器提供的,因此本地图像通常是更相关的图像。