使用python读取带有特殊字符的CSV

时间:2021-07-28 11:05:07

标签: python pandas csvfix

我想将下面的 CSV 文件读入 read_csv,由于 CSV 文件中的特殊字符,无法正确读取文件,数据框中列名中缺少特殊字符,并且数据在这里和那里,但excel数据显示正常。 你能帮忙解决这个问题吗,想要跳过 5 行并按原样读取剩余的数据并重命名列名

CSV 文件:- $$PROGRAM$$ 晶体管.csv
$$设备$$ 1
$$LOT$$ 手
$$DATE$$ 7/28/2021

$$FORMAT$$ ,SERIAL,COND=Temp,COND=vdd
1,BA1,25,1.2,7/12/201
1,BA2,25,1.2
1,BA2,25,1.2
1,BA3,25,1.2

import pandas as pd
import numpy as np
x=pd.read_csv(r"\trial.csv",index_col=None, header=0, skiprows=5, error_bad_lines=False,low_memory=False,encoding='utf8')

输出:-X

?????? SERIAL COND=Temp COND=vdd-
1 BA1 25 1.2 7/12/201-
1 BA2 25 1.2 NaN-
1 BA2 25 1.2 NaN-
1 BA3 25 1.2 NaN-

预期输出:
enter image description here

我得到了什么:-
enter image description here

1 个答案:

答案 0 :(得分:1)

我认为问题在于您的第一行数据实际上包含 5 个值,而您的标题只有 4 个列名(缺少日期列的名称)。

您可以尝试跳过标题并提供列标签:

pd.read_csv(r"\trial.csv",
    skiprows=6,
    names=['FORMAT', 'SERIAL', 'COND=TEMP', 'COND=vdd', 'date'],
    error_bad_lines=False,
    low_memory=False,
    encoding='utf8')
相关问题