在此处查看此网站:http://www.grammy.com/nominees/search?artist=&title=&year=1958&genre=All
我可以按年度查看所有获奖者 - 我如何在每个页面(每年)抓取获奖者的名字并将其放入一个简单的数据库中?
谢谢!
答案 0 :(得分:0)
这将为您提供实际名称,清理它们并将它们插入数据库是一项练习:
require 'rubygems'
require 'hpricot'
require 'open-uri'
html = open("http://www.grammy.com/nominees/search?artist=&title=&year=1958&genre=All")
doc = Hpricot(html)
doc.search("td.views-field-field-nominee-extended-value").each do |winner|
puts winner.inner_html.strip
end