使用pandas.read_excel加载复杂的Excel

时间:2015-03-05 04:07:42

标签: python pandas io ipython import-from-excel

我是python中的新手,特别是在熊猫中,我试图加载excel文件,其标题如下:

0 | first | | ... 1 | column | column2 | ... 2 | name | | ...

其中0,1,2 - 索引或文件中的行,我试图将其加载到padas.DataFrame中,如下所示:

dataset = pandas.read_excel('dataset.xls')

并且数据集包含名称为[' first',Unnamed:1,...]的列,但我想加载它以使其具有标题['第一列名称' ,' column2',...]。

有没有标准方法可以做到这一点?

1 个答案:

答案 0 :(得分:0)

我认为没有这样做的方法,因为这不是一般的操作。但您可以通过几个步骤轻松实现它:

1)从excel文件中读取前3行。

2)从中构造列名。

3)在不创建标题的情况下读取excel文件,跳过前3行(如果需要,则跳过第一列)。

4)使用您在第2步中获得的结果重新定义DataFrame的列名。