使用python进行网页抓取时,有没有直接方法从输出中删除\ xa0

时间:2020-01-30 20:17:14

标签: python web-scraping

代码:

date = [item.find(class_='wr-date__light').get_text() for item in items]

输出:

['31st\xa0January', '1st\xa0February', '3rd\xa0February', '4th\xa0February', '5th\xa0February', '6th\xa0February', '7th\xa0February', '8th\xa0February']

1 个答案:

答案 0 :(得分:0)

您可以使用字符串替换来删除字符。您可以使用map将其应用于列表的每个元素。

date = list(map(lambda s: s.replace('\xa0', ''), date))

如果您不习惯使用lambda表达式,则可以定义一个新函数。

def replace(text):
    return text.replace('\xa0', '')

date = list(map(replace, date))