Scrapy在网页中解析日期

时间:2017-09-21 08:56:42

标签: date scrapy format

我在网页中解析了日期:

<div class="solliciteren-voor">
<span class="label">Apply no later than : 
</span>
<span>September 30, 2017
</span>
</div>

使用:

response.xpath('//div[@class="solliciteren-voor"]//span/text()').extract()[1]

然而,结果是:“2017年9月30日”,预计不会“2017年9月30日”

这是怎么发生的? scrapy会自动将日期转换为特定格式吗?我们如何控制这个?

1 个答案:

答案 0 :(得分:0)

Scrapy不会修改下载的数据。更可能的原因是在页面源中,值为30/09/2017(即您获得的值),但是一些前端技术(例如JavaScript)在页面呈现期间格式化日期。