Question

我正在努力获得一个干净的输出，因为当我刮掉它提供的网站时，审查了7/20/2015所以我试图剥离它所以它只显示7/20/2015。这就是我一直在尝试的，当我测试它本身制作一个模拟字典并用值填充它时，这段代码可以工作但不是scrapy。我认为Field()只是dict = {value:[],value2:[]}所以我不知道为什么它不能用于Field()

这是代码段

for j in range(len(item['date'])):
    item['date'][j][9:].strip()

Answer 1

我会使用Selector的内置re()方法：

response.xpath("//div[@id='test']/text()").re(r"\d{1,2}/\d{1,2}/\d{4}")

如何在scrapy for python中删除字符串的某个部分

1 个答案: