Python请求模块无法获取它应该具备的所有元素

时间:2017-11-14 11:09:16

标签: python python-requests hidden

这段代码正常运行

from lxml import html
import requests
page = requests.get(c)
tree = html.fromstring(page.content)
link = tree.xpath('//script/text()')

但它无法获取整个内容。喜欢隐藏的东西。

我可以看到这种情况,因为我接下来要做的就是这个

print len(link)

并返回九(9)

然后我转到代码中上面的字符串c。我用mozilla转到源码(view-source :)。我点击了ctr + f,最后用<script写了一个空格。

它返回了三十三(33)场比赛。我想要的那个无法获取。

发生了什么事?我无法理解。我被封锁了什么?我怎样才能绕过这个并让请求模块看到mozilla看到了什么?

1 个答案:

答案 0 :(得分:0)

如果您尝试

tree.xpath('//script')

我希望你能得到33场比赛。

在您的页面上,只有九个元素包含开始和结束标记之间的内容。