如何在python中将xml文档/文件读入DOM?

时间:2010-07-12 18:33:28

标签: python xml dom screen screen-scraping

我需要进行屏幕抓取,为此我需要从python中读取一些xml。我希望得到一个合适的DOM树。我怎么能这样做?

2 个答案:

答案 0 :(得分:1)

查看the minidom package,其中也有示例。

顺便说一句,如果您的屏幕抓取是HTML,请不要使用XML解析。还有其他的东西。 (Question about screen scrapingQuestion about python HTML screen scraping)。

答案 1 :(得分:0)

lxml库适用于抓取HTML。以下是一些可以帮助您入门的链接: