提前感谢大家。 我在Python 2.7上使用Scrapy时遇到了问题。 我试图抓取的网页是a discussion board for Chinese stock market。 当我试图在这个页面的横幅下面得到第一个数字“42177”时(你在该网页上看到的数字可能不是你在这里显示的图片中看到的数字,因为它代表了这篇文章的次数)阅读并实时更新...),我总是得到一个空的内容。我知道这可能是动态内容问题,但还不知道如何正确抓取它。
我使用的代码是:
item["read"] = info.xpath("div[@id='zwmbti']/div[@id='zwmbtilr']/span[@class='tc1']/text()").extract()
我认为xpath设置正确,我已经检查了这个响应的返回值,它确实告诉我这个目录下没有任何内容。此处显示的结果为:'read': [u'<div id="zwmbtilr"></div>']
如果有某些内容,则<div id="zwmbtilr">
和</div>
之间应该存在某种内容。
非常感谢你们对此分享任何想法!