我从众多CSV文件中捕获了大量数据。某些信息已被删除。我编写的一个部分是一个包含大量各种文本格式的部分。其中一些是情绪和其他非标准文本。
将此数据输出为HTML格式时,我遇到了错误。目前我有以下错误:
UnicodeDecodeError:'charmap'编解码器无法解码位置中的字节0X90:字符映射到< undefined>。
程序当前将信息从String存储到Array中。然后将该数组写入HTML文件。
任何想法如何在Python 3.2中克服这个问题或如何实现字符缓冲区?
更新
我已尝试过以下评论,并进行了更多研究。
我使用此代码无济于事:
MessageArray.append(Message.encode('ascii', 'ignore'))
但是我得到了错误: TypeError:无法隐式地将'bytes'对象转换为str。
答案 0 :(得分:0)
我能够通过关注@SilverbackNet的评论解决我的问题。虽然这并没有解决我的整体问题,因为它能够从CSV导入和转换原始二进制数据,但允许忽略给我带来问题的数据。