我知道还有其他问题需要类似的东西,但是那些问题要求一个特定的产品这样做....我要求一个高级别的策略,如何解决这个任务,以便我可以写我自己的剧本
最好在PHP / Javascript
中完成此操作我的目标是使用页面中显示的最合适的图像来获取页面的缩略图 ...即使没有描述元标记,我也需要获得适当的描述...如果没有描述元标记,那么脚本应该从页面本身获得最适合用作描述的一些文本。 .....它与facebook的相似之处
如果你看一下:http://www.freakonomics.com/2008/09/24/wall-street-jokes-please/
并查看来源,该网站没有og:image标签告诉facebook使用哪个图片,也没有描述元标记
如果您在Facebook中“分享”它,Facebook会自动从页面中选择最合适的图像作为缩略图,并使用主页中显示的文本获取适当的描述......
他们究竟是如何做到这一点的,或者我应该如何使用PHP / Javascript来做类似的事情呢?如何区分页面描述/缩略图与纯噪音(广告,链接,按钮,横幅等)的相应文本/图像?
答案 0 :(得分:0)
我认为他们正在寻找与网站相同的网域上匹配特定宽度/高度的所有<img src
。当一个网站没有fb标签并且必须猜测时,它允许您在几个缩略图之间进行选择以选择最合适的标签。
这个问题在于它可能占用了大量的处理能力,而这些处理能力必须在飞行中完成。速度和可扩展性将成为一个因素,除非你是像Facebook这样拥有强大功能和技术的公司。
那说当然可以这样做,看一下similar question我提出了一段时间。
答案 1 :(得分:0)
查看此网站http://imagevat.com/muupload.php这是什么意思?