我有许多Excel电子表格可以使用Django处理成MYSQL。我保存为CSV和处理文件。我遇到的问题是字段中包含各种十六进制字符。我开始尝试在python中替换它们,但它变得不可行。
作为示例,一个字段中包含字符“”,当我将记录保存到MYSQL时,我收到以下错误。
警告:字符串值不正确:'\ xC2A sim ...'代表第1行的“描述”列
我尝试将MYSQL中的字段类型更改为ucf8_general_ci,但它还没有解决问题。
我尝试通过下面的reformat_content函数运行我的字符串来玩unhexlify,但它也没有区别。
def asciirepl(match):
# replace the hexadecimal characters with ascii characters
s = match.group()
return binascii.unhexlify(s[2:])
def reformat_content(data):
p = re.compile(r'\\x(\w{2})')
return p.sub(asciirepl, data)
关于如何在整个十六进制字符范围内解决这个问题的任何想法?
非常感谢
富