我喜欢Python中的Beautiful Soup抓图库。它只是有效。 Ruby中是否有相当的等价物?
答案 0 :(得分:10)
Nokogiri是另一个HTML / XML解析器。根据{{3}},它比hpricot更快。 Nokogiri使用libxml2并且是hpricot的替代品。它还有css3选择器支持,非常好。
编辑:有一个比较nokogiri,libxml-ruby,hpricot和rexml these benchmarks的新基准。
here在HTML解析器Ruby Toolbox上有一个类别。
答案 1 :(得分:4)
有scRUBYt!, Rubyful-soup(不再维护), WWW::Mechanize, scrAPI还有一些。
或者您可以使用Hpricot或Nokogiri进行解析。
答案 2 :(得分:3)
Ruby Toolbox的此页面包含各种解析器相对受欢迎程度的图表。
答案 3 :(得分:1)
Hpricot?我不知道别人在用什么...