我想将下面的 CSV 文件读入 read_csv,由于 CSV 文件中的特殊字符,无法正确读取文件,数据框中列名中缺少特殊字符,并且数据在这里和那里,但excel数据显示正常。 你能帮忙解决这个问题吗,想要跳过 5 行并按原样读取剩余的数据并重命名列名
CSV 文件:-
$$PROGRAM$$ 晶体管.csv
$$设备$$ 1
$$LOT$$ 手
$$DATE$$ 7/28/2021
$$FORMAT$$ ,SERIAL,COND=Temp,COND=vdd
1,BA1,25,1.2,7/12/201
1,BA2,25,1.2
1,BA2,25,1.2
1,BA3,25,1.2
import pandas as pd
import numpy as np
x=pd.read_csv(r"\trial.csv",index_col=None, header=0, skiprows=5, error_bad_lines=False,low_memory=False,encoding='utf8')
输出:-X
?????? SERIAL COND=Temp COND=vdd-
1 BA1 25 1.2 7/12/201-
1 BA2 25 1.2 NaN-
1 BA2 25 1.2 NaN-
1 BA3 25 1.2 NaN-
答案 0 :(得分:1)
我认为问题在于您的第一行数据实际上包含 5 个值,而您的标题只有 4 个列名(缺少日期列的名称)。
您可以尝试跳过标题并提供列标签:
pd.read_csv(r"\trial.csv",
skiprows=6,
names=['FORMAT', 'SERIAL', 'COND=TEMP', 'COND=vdd', 'date'],
error_bad_lines=False,
low_memory=False,
encoding='utf8')