很长一段时间以来,我一直遇到一个问题,这个问题永远都无法解决,我想问一下如何使用prettify()和encode()以及从编码中删除b'前缀。 当我收到该unicode错误时,我尝试对其进行编码,但是prettifier被禁用,我的html变得如此混乱,最重要的是,它创建了b'前缀,这使我无法从html抓取链接。
在此先感谢您的帮助!
import requests
from bs4 import BeautifulSoup
resource = requests.get('https://amazon.fr')
soup = BeautifulSoup(resource.text, 'lxml')
print(soup)
打印(汤) UnicodeEncode
enter code here
错误:'cp949'编解码器无法在位置37870编码字符'\ xe9':非法的多字节序列