我对查找网页数据的方法感兴趣,例如标题,封面图片和一些文字,当你想与墙上的链接分享时,它是如何做到的。
我想到了。是的,我可以向页面发送HTTP请求,获取所有网页并在以后解析。但是Facebook如何成功地为每个网页成功,因为并非所有的网站结构都是相同的。
从输入的网址中找到标题,封面图片和某些文字的最佳算法是什么?
答案 0 :(得分:1)
查看以下脚本。他们使用meta标签从网站收集数据。 http://www.techumber.com/2012/11/exactly-facebook-like-url-parsing-using.html
答案 1 :(得分:0)
没有完美的解决方案。 Facebook使用元标记(他们的网站管理员)来接收正常结果。 如果标签不存在,结果很差。 如果你担心问题的实际方面,首先你应该检查Facebook和其他社交网络的标签=)