我正在尝试像url scraper一样实现facebook。您在其中输入网站URL和Facebook获取该页面的视频或图像,标题,描述表单。 Facebook使用og:meta标签来抓取网站。 facebook允许我们使用他们的url scraper或url调试器。他们可以用其他任何方式做到这一点吗?
我尝试使用雅虎查询语言。但它不返回元标记的属性属性。
答案 0 :(得分:2)
试试这个宝石https://github.com/intridea/opengraph
它解析页面并提取og信息:
require 'opengraph'
movie = OpenGraph.fetch('http://www.rottentomatoes.com/m/1217700-kick_ass/')
movie.title # => 'Kick-Ass'
movie.movie? # => true
movie.image # => 'http://images.rottentomatoes.com/images/movie/custom/00/1217700.jpg'