如何正确索引二维数组的熊猫数据框?

时间:2019-07-28 17:27:50

标签: python python-3.x pandas

我正在将.xslx excel文件读入熊猫数据框。

这是它的样子:

Image Link

或以文本形式:

         1           2           3          4
3.5 15.48403728 23.22605592 30.96807456 38.7100932
4   17.41954194 26.12931291 34.83908388 43.54885485
4.5 19.3550466  29.0325699  38.7100932  48.3876165
5   21.29055126 31.93582689 42.58110252 53.22637815

如您所见,左上角的单元格中有一个空白。

行是金额,列是实质,值是价格。

我真的不知道如何为索引正确命名。

如果我要尝试

df.columns = ['Material 1',...'Material 4']

这是错误的,因为很明显它想要5列标题,因为有5列。

我真正想要的是将左上角的标签标记为数量/材料或类似的东西,但是我不知道如何做。

我认为最好的方法是让我尝试将此数据帧转换为如下形式:

Amount Material   Price
3.5       1       15.48...
3.5       2       23.22...
...
5         4       53.22...

因为这有望使它更易于处理。

有什么想法吗?

我相信这在excel中称为“不可透视的列”之类的东西??

1 个答案:

答案 0 :(得分:0)

我不确定您如何阅读excel文件,但是如果您只想重命名列,则可以在读取excel本身的同时设置列名。 假设我的文件名为MyExcelFile.xlsx,并且列名分别为“ Amount”,“ Material_1”,“ Material_2”,“ Material_3”和“ Material_4”,那么我将按以下说明进行阅读。如果这些列名不存在(在excel中),则必须显式传递header = None。

address = get_reply.data.find('{http://cisco.com/ns/yang/Cisco-IOS-XE-ethernet}interface')

输出如下。

Output of the reading

请参阅此处的文档(https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html)。如果您已经按照我上面的建议进行了操作,那么很抱歉我低估了您的问题要求。一切顺利