浏览lxml类别

时间:2011-10-27 15:21:19

标签: python graph lxml

我有一个网络解析,现在我想浏览标签,或显示图表。 我怎样才能获得图表?或者浏览树。显示第一步然后是其他,等等。并且了解树是如何建造的。

import urllib
from lxml import etree
import StringIO
resultado=urllib.urlopen('trozo.html')
html = resultado.read()
parser= etree.HTMLParser()
tree=etree.parse(StringIO.StringIO(html),parser)

我只想检查节点!图表很酷但我只想检查它!

1 个答案:

答案 0 :(得分:1)

您完成了解析,如果您执行以下操作,则可以看到:

>>> tree
<lxml.etree._ElementTree object at 0x0148AF08>

现在,您可以使用此处记录的lxml._ElementTree函数来浏览此元素:http://lxml.de/tutorial.html

以下是一些基础知识,我从本地网络获得了一个简单的文件:

>>> tree.getroot()
<Element html at 147aae0>
>>> tree.getroot().tag
'html'
>>> tree.getroot().text
>>> for child in tree.getroot().getchildren():
        print child.tag, child.getchildren()
head
body
>>> for child in tree.getroot().getchildren():
        print child.tag, [sub_child.tag for sub_child in child.getchildren()]
head ['title']
body ['h1', 'p', 'hr', 'address']