我有一个网络解析,现在我想浏览标签,或显示图表。 我怎样才能获得图表?或者浏览树。显示第一步然后是其他,等等。并且了解树是如何建造的。
import urllib
from lxml import etree
import StringIO
resultado=urllib.urlopen('trozo.html')
html = resultado.read()
parser= etree.HTMLParser()
tree=etree.parse(StringIO.StringIO(html),parser)
我只想检查节点!图表很酷但我只想检查它!
答案 0 :(得分:1)
您完成了解析,如果您执行以下操作,则可以看到:
>>> tree
<lxml.etree._ElementTree object at 0x0148AF08>
现在,您可以使用此处记录的lxml._ElementTree
函数来浏览此元素:http://lxml.de/tutorial.html
以下是一些基础知识,我从本地网络获得了一个简单的文件:
>>> tree.getroot()
<Element html at 147aae0>
>>> tree.getroot().tag
'html'
>>> tree.getroot().text
>>> for child in tree.getroot().getchildren():
print child.tag, child.getchildren()
head
body
>>> for child in tree.getroot().getchildren():
print child.tag, [sub_child.tag for sub_child in child.getchildren()]
head ['title']
body ['h1', 'p', 'hr', 'address']