我在网页中解析了日期:
<div class="solliciteren-voor">
<span class="label">Apply no later than :
</span>
<span>September 30, 2017
</span>
</div>
使用:
response.xpath('//div[@class="solliciteren-voor"]//span/text()').extract()[1]
然而,结果是:“2017年9月30日”,预计不会“2017年9月30日”
这是怎么发生的? scrapy会自动将日期转换为特定格式吗?我们如何控制这个?
答案 0 :(得分:0)
Scrapy不会修改下载的数据。更可能的原因是在页面源中,值为30/09/2017
(即您获得的值),但是一些前端技术(例如JavaScript)在页面呈现期间格式化日期。