Pandas pd.pivot_table与NaN指数

时间:2017-09-19 16:31:06

标签: python pandas

使用pd.pivot_table(df, index=[col1], values=[val1])时,生成的数据透视表会删除df col1NaN的结果。

我可以使用NaN预先填充df[col1].fillna('#', inplace=True),但这会修改​​数据,我不想这样做。

如上所述,我可以在df2 = df.copy()预填充之前执行df2,但我的数据很大,因此不希望不必要地执行额外的复制。

有没有办法可以在指定为索引的列中使用NaN值来转移数据框,而不会生成的转轴丢弃NaN索引及其聚合值?

1 个答案:

答案 0 :(得分:1)

此时,无法在数据透视表的索引中使用NaN。当你经历过时,它会被默默地丢弃。我认为今天你最好的选择是使用fillna路线来执行你的支点。

如果您需要更多颜色,可以在StackOverflow here上询问。

我也很难找到明确的答案;我怀疑它与默认情况下groupby丢弃NaN有关。我在Github上打开issue并得到确认。这是一个已知问题,甚至还有一个PR(可能是陈旧的)。