当使用Javascript加载内容时,如何使用Nokogiri解析页面?

时间:2013-02-11 03:23:04

标签: ruby ruby-on-rails-3 nokogiri

我正在尝试解析Twitch.tv website中的一些内容,作为Nokogiri的学习练习。

在获取HTML文档时,我没有获得我在Google Chrome上看到的来源,似乎内容是通过Javascript加载的,而不是最初的GET请求。

如何使用Nokogiri解析该网站的流列表?或者更一般地说,如何解析在DOM加载完成后动态加载的内容?

1 个答案:

答案 0 :(得分:5)

数据是json所以你不使用nokogiri。例如:

require 'open-uri'
require 'json'
hash = JSON.parse open('http://api.twitch.tv/kraken/games/top?limit=10&on_site=1').read