我遇到编码问题。
我的 csv文件(编码UTF-8):
ID,标题,FullDescription
55408086,注塑产品设计师,•工具经验是一个优势•汽车经验是必须的
和我的 python代码(简化):
# -*- coding: utf-8 -*-
import csv
import codecs
with codecs.open('D:\\Downloads\\Train_rev2.csv', 'rb', encoding='utf-8') as csv_file:
data = csv.reader(csv_file, delimiter=',')
data.next()
for row in data:
print (row[0], row[1], row[2])
打印:
('55408086','注塑成型产品设计师','\ xe2 \ x80 \ xa2工具经验是一个优势\ xe2 \ x80 \ xa2汽车经验是必须的')
然后我将数据插入数据库( MYSQL ,编码为UTF-8 Unicode(utf8)),我得到的数据编码错误:
55408086,Injection Moulding Product Designer,• Tooling experience is an advantage • Automotive experience is as must