如何从其他人的博客文章中提取标题,图像并在自己的网站上发布

时间:2015-09-28 11:20:52

标签: javascript jquery html

我打算建立一个网站,在那里我可以分享精心挑选的精选内容,但我无法理解将这些数据输入我的网站而不通过API的基本想法。

我首先想到的是,我应该检查我想要嵌入到我的网站上的页面的源HTML,并使用类似$('div.post').find('img').attr('src')的内容访问它。 但我无法想象自己每次都这样做,所以我想必须有更好的方法。

这就是Google+对其帖子所做的事情。添加网址链接后,会在一秒钟之后从链接页面中提取特色图片和一些文字片段。

2 个答案:

答案 0 :(得分:1)

你不能用javascript做这个。您需要一个服务器端脚本来下载您需要的页面,然后使用DOM解析器解析它。

使用PHP,您可以使用cURL获取一个URL的内容。

查看更多:

http://php.net/manual/es/book.curl.php

答案 1 :(得分:1)

许多网站使用Open graph protocol获取任何网址的元标题,元描述,图片等。

例如open:view-source:https://blog.kissmetrics.com/open-graph-meta-tags/并搜索“Open Graph Protocol Meta”。

它们包含在页面源中。您必须向要抓取的URL发送请求,并通过Regular Expr / HTML Parsers读取相应的元标记。