如何使用response.css提取时删除/ n和逗号

时间:2019-10-30 05:14:20

标签: python css web-scraping

我正在尝试搜寻亚马逊以获取产品名称,价格和[储蓄信息]。我正在使用response.css提取如下的[保存信息]

提取[储蓄信息]的python代码:

savingsinfo = amzscrape.css(".a-color-secondary .a-row , .a-row.a-size-small.a-color-secondary span").css('::text').extract()

使用上面的代码返回下面的输出

'savingsinfo_item': ['Save ',                                                   
                     '$20.00',
                     ' when you buy ',
                     '$100.00',
                     ' of select items']

预期输出:

Save $20.00 when you buy $100 of select items

2 个答案:

答案 0 :(得分:2)

output = ''.join(savingsinfo['savingsinfo_item'])

答案 1 :(得分:0)

这将返回一个列表。您所需要做的就是加入如图所示的项目。

list = ['1', '2', '3', '4']
seperator = ' '
print(seperator.join(list))