此数据来自Oracle数据库,并以编码'WE8MSWIN1252'的形式提取到flatfiles。
我想解析数据并做一些分析。我想查看文本字段,但不需要将结果发布到任何其他系统,因此如果某些字符没有完美转换,我就没有问题了。
我只是不希望我的解析失败并出现解码错误,如果我使用的话,这就是我得到的:
inputFile = codecs.open(dataFileName,“r”,“utf-8'”)
答案 0 :(得分:2)
从最后几个字符开始,我猜这个编码就是世界其他地方所谓的windows-1252。所以试试:
inputFile = codecs.open(dataFileName, "r", "windows-1252")