我知道这里有类似的问题已经被解决了,但是所提供的方法都没有解决我的问题。
我想做什么:
我从网页上获取了大量数据并用Python解析它们,将结果写入CSV文件。
我现在使用的代码类似于:
with urllib.request.urlopen('http://xxxxxx.com.br/') as response:
soup = BeautifulSoup(response.read().decode('utf-8','replace'), 'html.parser')
#lots of parsing here
with open('exit.csv', 'w', newline='') as csvfile:
exit_writer = csv.writer(csvfile, delimiter=';', quotechar='"', quoting=csv.QUOTE_MINIMAL)
for cat in categories:
exit_writer.writerow([a.encode('utf-8') for a in cat])
代码运行,但它总是以b'开始单元格/字符串,所有特殊字符将被替换为\ xe2 \ x80 \ x93
之类的代码我做错了什么,如何解决这个问题?
谢谢!