标签: php parsing dom thumbnails
当在Reddit,Facebook和其他各种网站上发布链接时,它通常包含页面上图像的缩略图。
这些网站如何在网页上找到最重要或最相关的图片,有效地忽略网站徽标,横幅广告等?
相关:How major websites capture thumbnails from a link?
答案 0 :(得分:1)
parse the page,并寻找更大的图片。没有确定最佳图像的确定方法。
您还可以考虑通过查找包含“ad”文本和“ad”文本的任何内容来过滤广告。