在网页上查找最重要的图像

时间:2011-11-04 11:02:27

标签: php parsing dom thumbnails

当在Reddit,Facebook和其他各种网站上发布链接时,它通常包含页面上图像的缩略图。

这些网站如何在网页上找到最重要或最相关的图片,有效地忽略网站徽标,横幅广告等?

相关:How major websites capture thumbnails from a link?

1 个答案:

答案 0 :(得分:1)

parse the page,并寻找更大的图片。没有确定最佳图像的确定方法。

您还可以考虑通过查找包含“ad”文本和“ad”文本的任何内容来过滤广告。