Question

我从众多CSV文件中捕获了大量数据。某些信息已被删除。我编写的一个部分是一个包含大量各种文本格式的部分。其中一些是情绪和其他非标准文本。

将此数据输出为HTML格式时，我遇到了错误。目前我有以下错误：

UnicodeDecodeError：'charmap'编解码器无法解码位置中的字节0X90：字符映射到＆lt; undefined＆gt;。

程序当前将信息从String存储到Array中。然后将该数组写入HTML文件。

任何想法如何在Python 3.2中克服这个问题或如何实现字符缓冲区？

更新

我已尝试过以下评论，并进行了更多研究。

我使用此代码无济于事：

MessageArray.append(Message.encode('ascii', 'ignore'))

但是我得到了错误： TypeError：无法隐式地将'bytes'对象转换为str。

Answer 1

我能够通过关注@SilverbackNet的评论解决我的问题。虽然这并没有解决我的整体问题，因为它能够从CSV导入和转换原始二进制数据，但允许忽略给我带来问题的数据。