应用错误收集

我知道这里有类似的问题已经被解决了，但是所提供的方法都没有解决我的问题。

我想做什么：

我从网页上获取了大量数据并用Python解析它们，将结果写入CSV文件。

我现在使用的代码类似于：

with urllib.request.urlopen('http://xxxxxx.com.br/') as response:
soup = BeautifulSoup(response.read().decode('utf-8','replace'), 'html.parser')

#lots of parsing here

with open('exit.csv', 'w', newline='') as csvfile:
    exit_writer = csv.writer(csvfile, delimiter=';', quotechar='"', quoting=csv.QUOTE_MINIMAL)
    for cat in categories:
        exit_writer.writerow([a.encode('utf-8') for a in cat])

代码运行，但它总是以b'开始单元格/字符串，所有特殊字符将被替换为\ xe2 \ x80 \ x93

之类的代码

我做错了什么，如何解决这个问题？

谢谢！

使用csvwriter和urllib进行Python编码

0 个答案: