Python:如何处理替换字符�

时间:2017-05-09 16:35:25

标签: python csv encoding utf-8 character-encoding

我正在阅读csv文件并遇到问题'invalid continuation byte'), errno is utf-8当它到达一个名为Maga�a的行时会发生Magaña Windows 1252 } (如果我在Atom(我的编辑器)中打开csv文件并让它自动检测它选择的编码并将ñ转换为

我的问题是,在打开或读取文件以插入数据库时​​,如何将ñ转换为print 'Maga�a'.decode('windows-1252').encode('utf-8')

我已经尝试过这个测试:

Maga�a

打印reader = open("my_csv.txt", "r") for csv_row in reader: # insert_row_sql = 'INSERT INTO sometable VALUES (%s,%s,%s,%s,%s,.... )' csv_values = csv_row.replace("\n", "").split(',') cursor.execute(insert_row_sql, csv_values) # blows up, error msg edited # Got error UnicodeDecodeError('utf-8', b'Maga\xf1a, 'invalid continuation byte'), errno is utf-8

示例代码:

{{1}}

0 个答案:

没有答案