我被困住了,我觉得很蠢。
我有一个带有推文的数据库,我正在使用.NET导出到.CSV。我想使用Pandas和NLTK使用Python分析这些数据。但是我完全坚持第一步,即:“用Python阅读CSV”。这导致了这个问题:Python open CSV file with supposedly mixed encodings?
如果我是创建文本文件的人,打开文件并打印文本会不会那么难?
我正在使用以下C#
代码生成CSV文件(假设在UTF8
?)
using (FileStream fs = new FileStream(fullFileName, FileMode.Append, FileAccess.Write)) using (StreamWriter sw = new StreamWriter(fs, Encoding.UTF8))
根据 chardet ,编码为:ISO-8859-2
。
非常感谢正确方向的一点暗示......
答案 0 :(得分:1)
如果编码是ISO-8859-2,请尝试告诉Python用它打开它。例如。 open('filename', encoding='iso-8859-2')
。