之前我曾使用xmlstartlet处理XML文件。您可以为它提供一个简单的comannd行,它将生成(内部)XSLT模板并将其应用于XML文件。
但是现在我有一个大的XML文件,所以我真的需要使用SAX,而不是XSLT。而不是编写一个简单的程序来执行此操作,我想知道是否有更简单的方法,从命令行有一个非常简单的SAX解析器。您可以给它一些选项,它会沿着您的XML文件发送并从中打印出一些结构化数据。
答案 0 :(得分:2)
下载Python并以交互式命令行模式运行它。
答案 1 :(得分:0)
不确定你要提取什么以及如何(因为sax你需要自己做所有事情) - 所以“配置”非常复杂因此没有命令行工具,只是编程语言让你做萨克斯。
你的xml有多大?也许http://ofb.net/~egnor/xml2/可以提供帮助(也取决于你的xml的大小。
答案 2 :(得分:0)
同样,我有1.1G xml文件。
使用xsltproc需要超过6G的内存,但完成。
我也尝试过撒克逊,但内存不足,失败。
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
最后,我们遵循了danglund的建议并使用了Python,ATM。