所以我正在使用它:
Net::HTTP.get(URI.parse(url))
完美无缺。
我遇到的问题是它获取的页面是使用head,html,body等标签格式化的。 正文中有一个标签元素,其ID为“结果”我只想让我回到“结果”的文本。不是所有的HTML格式。
可以这样做吗?
答案 0 :(得分:3)
好吧,要只获取HTML中的部分内容,您必须使用HTML解析器,在这种情况下为Nokogiri。
doc = Nokogiri::HTML(open(url))
doc.css('#Result').each do |re|
puts re.to_s
#puts re.content
end