答案 0 :(得分:13)
我不相信有一种标准方法。您可以从查找Open Graph Protocol图片代码开始。 Facebook使用这些来为状态更新和评论中发布的网址选择图像。
<meta property="og:image" content="http://ia.media-imdb.com/rock.jpg"/>
如果您准备使用第三方,Embedly将此作为收费服务提供。
Embedly提供了一个功能强大的API,可将标准网址转换为嵌入式网址 来自218家领先供应商的视频,图片和丰富的文章预览。
答案 1 :(得分:10)
有很多策略可以确定网址的“主要”图片是什么:
我创建了一个JavaScript库,它使用大多数这些技术来确定网址的“主要”图片:ImageResolver。
答案 2 :(得分:3)
确实没有任何东西被认为是网页中的“主要”图像 - 没有HTML或其他任何东西来区分它。更不用说你可能必须阅读CSS中的所有图像(或者更确切地说是背景图像等)。但如果我必须这样做,我会做的就是:
一旦达到预定数量的图像,我就检查了
(因为参数可以说是10,但肯定你可能要高得多)我会使用我发现的最大图像(存放到侧面),因为我不想无限期地扫描页面对于图像!
答案 3 :(得分:0)
Facebook允许用户选择其中一个被认为是“主要”图像的图像之一。至于自动确定“主”图像,我会根据页面位置,大小,与文本的关系以及(如果你想要更复杂)的视觉内容来判断它。
例如,您可以使用简单的人脸检测程序,或者查看颜色分类以确定图片是否对您“感兴趣”。
编辑:在www.nytimes.com的情况下,我可能只是看一下页面结构,因为一个大的图像旋转木马正好位于H1标签下面。