我正在尝试使用Pandas来利用dataframe.interpolate
来填补时间序列中的空白,但是在设置该函数所需的索引时遇到了问题。
它提出了一个更笼统的问题:Pandas数据框由多个列组成,每个列都包含一个dtype
项。还有一个行索引,对于我来说,它看起来很像一列。
那么...一个数据帧(行)索引与所有其他列之间有什么区别?例如,我可能以为所有索引条目都必须是唯一的,就像SQL数据库键一样,但是看起来不是这样吗?那么,与非索引列相比,行索引又有什么特别之处呢?
答案 0 :(得分:0)
索引允许loc命令调用指定的行。如果有重复项,则可以调用所有重复项。如果要指定一行,请使用分层索引或iloc(数字位置)。
索引内值的重复非常重要,因为它有助于层次化索引。这在大熊猫中非常有用
因此,索引是您分配为索引的行。删除列(通过将其分配给索引),操作数据框并将索引重新引入为列也非常有用。
插值是一个非常酷的命令,但是从内存来看,它仅适用于列。如果要插入索引,
df.reset_index(inplace=True)
然后插入该新列,然后
df.set_index('column interpolated', inplace=True)
对于时间序列,请考虑roll
函数。您可以使用它来查找丢失的数据。