如何从像Facebook这样的链接获取元属性(图像,视频,标题..)?

时间:2011-09-09 16:25:57

标签: html ruby-on-rails ruby-on-rails-3 image fetch

我正在尝试为webapp添加功能,当用户发布链接时,会以某种方式提取标题图片URL,以便它可以显示在我的网络应用上。

Facebook已经做到了这一点;共享链接时,它会获取此信息并显示标题,模糊图片,图片等。

我知道它确定了相关数据:

 <meta name="title" content="title" />
 <meta name="description" content="description " />
 <link rel="image_src" href="thumbnail_image" />

但是我怎么能真正获取这些字符串呢?

我正在使用Ruby on Rails进行编程,因此与其兼容或使用javascript的答案最有用!

3 个答案:

答案 0 :(得分:2)

有一个宝石包含了OpenGraph,这是Facebook使用的。似乎它已闲置一年左右。

https://github.com/intridea/opengraph

答案 1 :(得分:0)

这叫做链接抓取。您需要同时使用客户端js和服务器端ruby。

流程如下:

  1. 您的客户端通过ajax
  2. 在您的服务器上调用scraper功能
  3. Scraper函数获取网址并检查相关元

答案 2 :(得分:0)

这可能有点晚了但我建议看一个名为nokogiri的宝石,它会让你使用css选择器或xpath从其他网页抓取数据。如果你想看看它能做什么,就会有一个关于它的轨道广播。 http://railscasts.com/episodes/190-screen-scraping-with-nokogiri