用于XML文件的命令行SAX解析器非常简单

时间:2009-08-05 22:49:19

标签: xml command-line sax

之前我曾使用xmlstartlet处理XML文件。您可以为它提供一个简单的comannd行,它将生成(内部)XSLT模板并将其应用于XML文件。

但是现在我有一个大的XML文件,所以我真的需要使用SAX,而不是XSLT。而不是编写一个简单的程序来执行此操作,我想知道是否有更简单的方法,从命令行有一个非常简单的SAX解析器。您可以给它一些选项,它会沿着您的XML文件发送并从中打印出一些结构化数据。

3 个答案:

答案 0 :(得分:2)

下载Python并以交互式命令行模式运行它。

DOCS http://docs.python.org/library/xml.sax.html

实施例: Showing progress while parsing a huge file in Python

答案 1 :(得分:0)

不确定你要提取什么以及如何(因为sax你需要自己做所有事情) - 所以“配置”非常复杂因此没有命令行工具,只是编程语言让你做萨克斯。

你的xml有多大?也许http://ofb.net/~egnor/xml2/可以提供帮助(也取决于你的xml的大小。

答案 2 :(得分:0)

同样,我有1.1G xml文件。

使用xsltproc需要超过6G的内存,但完成

我也尝试过撒克逊,但内存不足,失败

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space

最后,我们遵循了danglund的建议并使用了Python,ATM。