我正在尝试解析Twitch.tv website中的一些内容,作为Nokogiri的学习练习。
在获取HTML文档时,我没有获得我在Google Chrome上看到的来源,似乎内容是通过Javascript加载的,而不是最初的GET请求。
如何使用Nokogiri解析该网站的流列表?或者更一般地说,如何解析在DOM加载完成后动态加载的内容?
答案 0 :(得分:5)
数据是json所以你不使用nokogiri。例如:
require 'open-uri'
require 'json'
hash = JSON.parse open('http://api.twitch.tv/kraken/games/top?limit=10&on_site=1').read