这段代码正常运行
from lxml import html
import requests
page = requests.get(c)
tree = html.fromstring(page.content)
link = tree.xpath('//script/text()')
但它无法获取整个内容。喜欢隐藏的东西。
我可以看到这种情况,因为我接下来要做的就是这个
print len(link)
并返回九(9)
然后我转到代码中上面的字符串c。我用mozilla转到源码(view-source :)。我点击了ctr + f,最后用<script
写了一个空格。
它返回了三十三(33)场比赛。我想要的那个无法获取。
发生了什么事?我无法理解。我被封锁了什么?我怎样才能绕过这个并让请求模块看到mozilla看到了什么?
答案 0 :(得分:0)
如果您尝试
tree.xpath('//script')
我希望你能得到33场比赛。
在您的页面上,只有九个元素包含开始和结束标记之间的内容。