UnicodeDecodeError:'utf-8'编解码器无法解码位置15的字节0x96:无效的起始字节

时间:2019-07-04 06:39:56

标签: python-3.x pandas csv

import csv
import pandas as pd
db = input("Enter the dataset name:")
table = db+".csv"
df = pd.read_csv(table)
df = df.sample(frac=1).reset_index(drop=True)
with open(table,'rb') as f:
    data = csv.reader(f)
    for row in data:
        rows = row
        break
print(rows)

我正在尝试从csv文件中读取所有列。

  

错误:UnicodeDecodeError:'utf-8'编解码器无法解码位置15的字节0x96:无效的起始字节

1 个答案:

答案 0 :(得分:0)

您需要检查csv文件的编码。

为此,您可以像这样使用print(f)

with open('file_name.csv') as f:
    print(f)

输出是这样的:

<_io.TextIOWrapper name='file_name.csv' mode='r' encoding='utf8'>

使用这种编码打开csv

with open(fname, "rt", encoding="utf8") as f:

如评论中所述, 您的编码为cp1252

所以

with open(fname, "rt", encoding="cp1252") as f:
    ...

,对于.read_csv

df = pd.read_csv(table, encoding='cp1252')