我正在尝试为他们的所有现场赛事和相应赔率刮一个投注网站。
我在Scrapy Shell中验证了xpath响应,非常好,但是当我想从span标签提取文本时,没有响应。然后,我检查了网站的源页面,实际上,我尝试抓取的节点中没有文本。这是源页面中的代码:
<div class="sports-body" data-bind="visible: anyNonStarred">
<div class="league-title js-toggle-region">
<span class="icon arrow grey" data-bind="css:{selected:isExpanded}"></span>
<!-- ko if: $data.flagName && $data.flagName() -->
<span data-bind="attr:{'class':cssmap('flag flag-' + flagName())}"></span>
<!-- /ko -->
<span data-bind="text:name"></span>
</div>
这是因为该网站正在使用JavaScript吗?如果是这样,我怎么刮呢? Scrapy可以处理吗?
答案 0 :(得分:0)
从脚本中加载的那些缺失项意味着来自动态请求。您无法从页面源中获取这些元素。为此,您应该尝试一些动态抓取工具。