Question

有些问题的标题与我的相似，但没有一个回答我的问题。

我正在尝试读取格式为的xlsx文件

但是我得到以下错误：`错误标记数据。 C错误：第4行中应有1个字段，看到了3

我对读取数据的第1部分，第2部分或第3部分不感兴趣（但是我有很多这样的文件，因此无法删除它们）。我只想读取数据启动column1，column2，... column17。（让我们说删除前40行）这是我尝试过的：

data=pd.read_csv(Path)

我得到了错误标记数据。 C错误。

当我尝试使用header = None时，我也得到了同样的东西。我尝试了以下操作：

data=pd.read_csv(Path,error_bad_lines=False)

标记数据时出错。 C错误：捕获了缓冲区溢出

我尝试了以下操作：

data=pd.read_csv(Path,names=[column1,column2,....column17])

我收到此错误

'utf-8'编解码器无法解码位置的字节0xf2。

我不知道使用哪种编码，也不认为这是问题所在。我想跳过 xlsx文件的前40行也是如此，看来我无法将引擎更改为python，并且只能在默认引擎下使用。并正常读取数据。谁能帮助我加载和读取此数据？ `

更新：删除了section1，section2，...之后，我仍然得到标记错误。但是，删除上述部分可能会使某些文件的列损坏。

` 更新：为什么无法使用pd.read_excel（Path）读取文件，原因 pd.read_csv，因为它提供了比pd.read_excel更多的选项？

Answer 1

尝试使用，

data = pd.read_csv(path, skiprows=40)

这将跳过读取.csv文件中的前40行。

Answer 2

您可以 df = Pd.read_excel（path，skiprows = 40）您要达到的目的是从read_csv读取excel文件，这就是出现错误的原因。您可以使用它，但不会出现错误