Question

所以我正在使用它：

Net::HTTP.get(URI.parse(url))

完美无缺。

我遇到的问题是它获取的页面是使用head，html，body等标签格式化的。正文中有一个标签元素，其ID为“结果”我只想让我回到“结果”的文本。不是所有的HTML格式。

可以这样做吗？

Answer 1

好吧，要只获取HTML中的部分内容，您必须使用HTML解析器，在这种情况下为Nokogiri。

doc = Nokogiri::HTML(open(url))
doc.css('#Result').each do |re|
  puts re.to_s
  #puts re.content
end