我有一个以UTF-8编码的文本文件。我正在阅读它以分析和绘制一些数据。我希望将文件作为ascii读入。最好使用编解码器模块还是使用内置字符串解码方法?此外,该文件被划分为csv,因此csv模块也可以是有效的解决方案吗?
感谢您的帮助。
答案 0 :(得分:5)
你的意思是你的文件是用UTF-8编码的吗? (“Unicode”不是编码...必读:http://www.joelonsoftware.com/articles/Unicode.html)我不是100%肯定,但我认为你应该能够用csv模块读取UTF-8编码的文件,你可以在阅读后将包含特殊字符的字符串转换为Python的unicode字符串(如果需要,编辑:)。
在http://docs.python.org./library/csv.html#csv-examples处有一些使用带有UTF-8编码数据的csv的例子;它可能会帮助你看看它们。