Pandas数据框索引与其他列有何不同?

时间:2019-09-27 18:22:04

标签: pandas dataframe indexing

我正在尝试使用Pandas来利用dataframe.interpolate来填补时间序列中的空白,但是在设置该函数所需的索引时遇到了问题。

它提出了一个更笼统的问题:Pandas数据框由多个组成,每个列都包含一个dtype项。还有一个行索引,对于我来说,它看起来很像一列。

那么...一个数据帧(行)索引与所有其他列之间有什么区别?例如,我可能以为所有索引条目都必须是唯一的,就像SQL数据库键一样,但是看起来不是这样吗?那么,与非索引列相比,行索引又有什么特别之处呢?

1 个答案:

答案 0 :(得分:0)

索引允许loc命令调用指定的行。如果有重复项,则可以调用所有重复项。如果要指定一行,请使用分层索引或iloc(数字位置)。

索引内值的重复非常重要,因为它有助于层次化索引。这在大熊猫中非常有用

因此,索引是您分配为索引的行。删除列(通过将其分配给索引),操作数据框并将索引重新引入为列也非常有用。

插值是一个非常酷的命令,但是从内存来看,它仅适用于列。如果要插入索引,

df.reset_index(inplace=True)

然后插入该新列,然后

 df.set_index('column interpolated', inplace=True)

对于时间序列,请考虑roll函数。您可以使用它来查找丢失的数据。