有些问题的标题与我的相似,但没有一个回答我的问题。
但是我得到以下错误:`错误标记数据。 C错误:第4行中应有1个字段,看到了3
我对读取数据的第1部分,第2部分或第3部分不感兴趣(但是我有很多这样的文件,因此无法删除它们)。我只想读取数据 启动column1,column2,... column17。 (让我们说删除前40行)这是我尝试过的:
data=pd.read_csv(Path)
我得到了错误标记数据。 C错误。
当我尝试使用header = None时,我也得到了同样的东西。 我尝试了以下操作:
data=pd.read_csv(Path,error_bad_lines=False)
标记数据时出错。 C错误:捕获了缓冲区溢出
我尝试了以下操作:
data=pd.read_csv(Path,names=[column1,column2,....column17])
我收到此错误
'utf-8'编解码器无法解码位置的字节0xf2。
我不知道使用哪种编码,也不认为这是问题所在。我想跳过 xlsx文件的前40行也是如此,看来我无法将引擎更改为python,并且只能在默认引擎下使用。并正常读取数据。谁能帮助我加载和读取此数据? `
更新:删除了section1,section2,...之后,我仍然得到标记错误。但是,删除上述部分可能会使某些文件的列损坏。
` 更新:为什么无法使用pd.read_excel(Path)读取文件,原因 pd.read_csv,因为它提供了比pd.read_excel更多的选项?
答案 0 :(得分:1)
尝试使用,
data = pd.read_csv(path, skiprows=40)
这将跳过读取.csv
文件中的前40行。
答案 1 :(得分:1)
您可以 df = Pd.read_excel(path,skiprows = 40) 您要达到的目的是从read_csv读取excel文件,这就是出现错误的原因。您可以使用它,但不会出现错误