Question

page = requests.get('http://anywebsite/anysearch/') 
tree = html.fromstring(page.content)

lists =  tree.xpath('.//div[@class="normal-view"]')
print "lists"
for i in lists:
    print "1"
    title = i.xpath('.//div[@class="post-entry"/h1//a/@href]//text()')
    print title,"2"
print "3"

我已经给出了打印（“列表”，“1”，“2”，“3”）的声明，以检查程序是否进入循环。

我得到的输出是

lists
3
[Finished in 0.3s]

Answer 1

以下Python 2代码使用您提供的网址成功打印了正在审核的电影的标题。

from lxml import etree
parser = etree.HTMLParser()
tree = etree.parse("http://boxofficeindia.co.in/review-mirzya/", parser)
title = tree.xpath("string(//h1)")
print title

执行此操作会给出：

> python ~/test.py
Review: Mirzya

如果这不是您想要的，请在您的问题中更具体。

为什么它没有进入“for loop”

1 个答案: