间歇性地抛出beautifulSoup编码错误

时间:2018-06-08 07:07:23

标签: python encoding beautifulsoup

我正在使用BeautifulSoup来解析html页面,有时会抛出编码错误,如“编码错误:由于输入错误导致输入转换失败,字节0x9D 0x3C 0x2F 0x74” 我尝试用try来捕获这个错误,除了块以确切知道哪些行导致错误,因为我有很多行与BeautifulSoup但它不起作用,因为它看起来像BeautifulSoup只报告错误给stderr并忽略这些字符并继续工作< / p>

r  = requests.get("someurl")
try:
     soup = BeautifulSoup(r.content,"lxml")
except Exception as e:
     print(e)

有没有办法知道什么行确切地抛出错误以及导致编码错误的字符是什么?

0 个答案:

没有答案