patterns.web模块:查看直接父级是否具有某个字符串

时间:2014-02-27 22:39:43

标签: python screen-scraping

我在python中使用patterns web mining module。我试图抓住一些价值观,我想知道是否可以检查直接父母是否具有某种属性,而不是所有父母(包括祖父母等)。

在下面的图片中,是否可以仅检查哪个是具有某些属性的父级?当我使用val.parent时,我得到的不仅仅是。我想抓住名字' VICTOR ODZAU'。

提出这个问题的另一种可能方式更开放。有没有更有效的方法来获取名称VICTOR ODZAU?

dom = web.Element(req.text)
    for i, val in enumerate(dom.by_tag("td")):
    print val.parent.content
    if 'Name' in val.parent.content.encode('ascii','ignore'):
         val.content

Example of html

更新:

我明白了。事实证明,父函数确实抓住了直接父母,但是当树更复杂时会有怪癖。

0 个答案:

没有答案