使用Nokogiri和Libxml2解析大型XML文档

时间:2016-09-22 08:25:53

标签: c xml xslt xml-parsing nokogiri

我正致力于转换~3GB的XML文档,其结构为类似<Element>的列表。该文档太大,无法直接进行XSL转换。但是每个<Element>都可以独立转换,所以我解析XML并将它们分开。

在使用Nokogiri进行测试时,我发现性能很快就会上升到几分钟。作为测试,我直接使用libxml2在C中编写了一个示例解析器,速度要快得多。

代码和结果: https://gist.github.com/adilosa/d4277dc1c683da91990515352ffe5420

Nokogiri与C相比,期望10倍的开销是否合理?那么在C中处理大型文档是否值得?

0 个答案:

没有答案