最有效的下载和解析XML的方法

时间:2012-02-17 17:27:58

标签: xml linux performance parsing

我希望定期从远程位置下载XML文件,分析并将结果存储在数据库中。它将在我的专用Linux服务器上运行,但是,我不确定哪种方法最有效,因为我不确定不同语言的开销。

我已经查看了一些选项,我可以在PHP,Perl,Python或C中完全下载和分析它们,或者使用组合(一个用于下载,一个用于分析,一个用于存储在数据库中)。什么是最好的选择/组合?

提前为任何帮助干杯。

2 个答案:

答案 0 :(得分:1)

作为(非常)一般的经验法则,C将具有最小的开销并且将是最快的。 (因为它是编译的,而不是解释的。)

话虽如此,这种差异通常并不明显。除非你正在处理非常庞大的XML文档,否则你谈论毫秒。您选择使用的XML库的设计,而不是语言,将产生更大的影响。

我认为这是一个过早优化的案例。您事先知道您的XML文件是巨大的吗?选择你喜欢的语言。如果您遇到麻烦,然后可以将瓶颈导出为另一种语言。

我的猜测是你的网络连接瓶颈,而不是解析/分析/存储。

答案 1 :(得分:0)

Python非常容易使用:包xml.dom.minidom使很多东西变得非常简单。