我正在阅读csv文件并遇到问题'invalid continuation byte'), errno is utf-8
当它到达一个名为Maga�a
的行时会发生Magaña
Windows 1252
} (如果我在Atom(我的编辑器)中打开csv文件并让它自动检测它选择的编码�
并将ñ
转换为�
)
我的问题是,在打开或读取文件以插入数据库时,如何将ñ
转换为print 'Maga�a'.decode('windows-1252').encode('utf-8')
?
我已经尝试过这个测试:
Maga�a
打印reader = open("my_csv.txt", "r")
for csv_row in reader:
# insert_row_sql = 'INSERT INTO sometable VALUES (%s,%s,%s,%s,%s,.... )'
csv_values = csv_row.replace("\n", "").split(',')
cursor.execute(insert_row_sql, csv_values)
# blows up, error msg edited
# Got error UnicodeDecodeError('utf-8', b'Maga\xf1a, 'invalid continuation byte'), errno is utf-8
示例代码:
{{1}}