标记数据时出错。 C错误熊猫读取xlsx文件

时间:2019-10-06 04:49:39

标签: python pandas file csv xlsx

有些问题的标题与我的相似,但没有一个回答我的问题。

我正在尝试读取格式为enter image description here的xlsx文件

但是我得到以下错误:`错误标记数据。 C错误:第4行中应有1个字段,看到了3

我对读取数据的第1部分,第2部分或第3部分不感兴趣(但是我有很多这样的文件,因此无法删除它们)。我只想读取数据 启动column1,column2,... column17。 (让我们说删除前40行)这是我尝试过的:

data=pd.read_csv(Path)
  

我得到了错误标记数据。 C错误。

当我尝试使用header = None时,我也得到了同样的东西。 我尝试了以下操作:

data=pd.read_csv(Path,error_bad_lines=False)
  

标记数据时出错。 C错误:捕获了缓冲区溢出

我尝试了以下操作:

data=pd.read_csv(Path,names=[column1,column2,....column17])

我收到此错误

  

'utf-8'编解码器无法解码位置的字节0xf2。

我不知道使用哪种编码,也不认为这是问题所在。我想跳过 xlsx文件的前40行也是如此,看来我无法将引擎更改为python,并且只能在默认引擎下使用。并正常读取数据。谁能帮助我加载和读取此数据? `

更新:删除了section1,section2,...之后,我仍然得到标记错误。但是,删除上述部分可能会使某些文件的列损坏。

` 更新:为什么无法使用pd.read_excel(Path)读取文件,原因 pd.read_csv,因为它提供了比pd.read_excel更多的选项?

2 个答案:

答案 0 :(得分:1)

尝试使用,

data = pd.read_csv(path, skiprows=40)

这将跳过读取.csv文件中的前40行。

答案 1 :(得分:1)

您可以 df = Pd.read_excel(path,skiprows = 40) 您要达到的目的是从read_csv读取excel文件,这就是出现错误的原因。您可以使用它,但不会出现错误