以“原始”格式输出字符串数据

时间:2012-07-26 14:03:46

标签: python windows python-3.x

我从众多CSV文件中捕获了大量数据。某些信息已被删除。我编写的一个部分是一个包含大量各种文本格式的部分。其中一些是情绪和其他非标准文本。

将此数据输出为HTML格式时,我遇到了错误。目前我有以下错误:

  

UnicodeDecodeError:'charmap'编解码器无法解码位置中的字节0X90:字符映射到< undefined>。

程序当前将信息从String存储到Array中。然后将该数组写入HTML文件。

任何想法如何在Python 3.2中克服这个问题或如何实现字符缓冲区?

更新

我已尝试过以下评论,并进行了更多研究。

我使用此代码无济于事:

MessageArray.append(Message.encode('ascii', 'ignore'))

但是我得到了错误: TypeError:无法隐式地将'bytes'对象转换为str。

1 个答案:

答案 0 :(得分:0)

我能够通过关注@SilverbackNet的评论解决我的问题。虽然这并没有解决我的整体问题,因为它能够从CSV导入和转换原始二进制数据,但允许忽略给我带来问题的数据。