Question

这段代码正常运行

from lxml import html
import requests
page = requests.get(c)
tree = html.fromstring(page.content)
link = tree.xpath('//script/text()')

但它无法获取整个内容。喜欢隐藏的东西。

我可以看到这种情况，因为我接下来要做的就是这个

print len(link)

并返回九（9）

然后我转到代码中上面的字符串c。我用mozilla转到源码（view-source :)。我点击了ctr + f，最后用<script写了一个空格。

它返回了三十三（33）场比赛。我想要的那个无法获取。

发生了什么事？我无法理解。我被封锁了什么？我怎样才能绕过这个并让请求模块看到mozilla看到了什么？

Answer 1

如果您尝试

tree.xpath('//script')

我希望你能得到33场比赛。

在您的页面上，只有九个元素包含开始和结束标记之间的内容。