我需要进行屏幕抓取,为此我需要从python中读取一些xml。我希望得到一个合适的DOM树。我怎么能这样做?
答案 0 :(得分:1)
查看the minidom package,其中也有示例。
顺便说一句,如果您的屏幕抓取是HTML,请不要使用XML解析。还有其他的东西。 (Question about screen scraping,Question about python HTML screen scraping)。
答案 1 :(得分:0)
lxml库适用于抓取HTML。以下是一些可以帮助您入门的链接: