Nokogiri vs Hpricot?

时间:2010-05-22 15:05:10

标签: ruby nokogiri html-parsing hpricot

你会选择哪一个?我的重要属性是(不按顺序):

  1. 支持和未来的改进。
  2. 社区和一般知识库(在互联网上)。
  3. 综合(I.E.,证明可以解析各种*。* ml页面)。
  4. 性能。
  5. 内存占用(运行时,而不是代码库)。

3 个答案:

答案 0 :(得分:35)

选择Nokogiri,所有要点,特别是第一点:Hpricot是no longer maintained

Meta回答:请参阅ruby-toolbox以了解特定区域内不同工具的受欢迎程度。

答案 1 :(得分:8)

如果您没有或无法在您正在使用的计算机上安装LibXML,则只选择Hpricot。如果情况并非如此,那么选择Nokogiri,它在提到的五个属性中比Hpricot更好。

答案 2 :(得分:6)

我发现Hpricot有用的情况是处理破坏的HTML,你需要在处理后保持破坏。 Hpricot很适合仅修改已更新文档的部分。除非需要,否则Nokogiri就是您的选择。