用奇怪的html报废网站

时间:2018-11-06 16:49:30

标签: python python-3.x beautifulsoup python-requests

有人知道为什么这个site的html在单词之间有空格吗?

可以清洁使用BeautifulSoup吗?

enter image description here

1 个答案:

答案 0 :(得分:0)

我似乎没有这个问题...您的代码与此明显不同吗?

import requests
from bs4 import BeautifulSoup

url = 'https://rs.olx.com.br/regioes-de-porto-alegre-torres-e-santa-cruz-do-sul/imoveis/casa-em-canoas-no-bairro-igara-iii-457256663'
resp = requests.get(url)
soup = BeautifulSoup(resp.content, 'html.parser')