我正在努力获得一个干净的输出,因为当我刮掉它提供的网站时,审查了7/20/2015所以我试图剥离它所以它只显示7/20/2015。这就是我一直在尝试的,当我测试它本身制作一个模拟字典并用值填充它时,这段代码可以工作但不是scrapy。我认为Field()
只是dict = {value:[],value2:[]}
所以我不知道为什么它不能用于Field()
这是代码段
for j in range(len(item['date'])):
item['date'][j][9:].strip()
答案 0 :(得分:1)
我会使用Selector的内置re()
方法:
response.xpath("//div[@id='test']/text()").re(r"\d{1,2}/\d{1,2}/\d{4}")