我正致力于转换~3GB的XML文档,其结构为类似<Element>
的列表。该文档太大,无法直接进行XSL转换。但是每个<Element>
都可以独立转换,所以我解析XML并将它们分开。
在使用Nokogiri进行测试时,我发现性能很快就会上升到几分钟。作为测试,我直接使用libxml2在C中编写了一个示例解析器,速度要快得多。
代码和结果: https://gist.github.com/adilosa/d4277dc1c683da91990515352ffe5420
Nokogiri与C相比,期望10倍的开销是否合理?那么在C中处理大型文档是否值得?