Question

我在网页中解析了日期：

<div class="solliciteren-voor">
<span class="label">Apply no later than : 
</span>
<span>September 30, 2017
</span>
</div>

使用：

response.xpath('//div[@class="solliciteren-voor"]//span/text()').extract()[1]

然而，结果是：“2017年9月30日”，预计不会“2017年9月30日”

这是怎么发生的？ scrapy会自动将日期转换为特定格式吗？我们如何控制这个？

Answer 1

Scrapy不会修改下载的数据。更可能的原因是在页面源中，值为30/09/2017（即您获得的值），但是一些前端技术（例如JavaScript）在页面呈现期间格式化日期。