熊猫放置功能可提供更多行

时间:2018-11-21 13:41:45

标签: python pandas

原始df有100000行,我这里有一个要从df中删除的索引列表。

此列表具有27346行,因此在执行索引删除功能后df应该具有(100000-27346)行,但是它有72852行,并且超出了预期。

len(df) = 100000
len(index_list) = 27346
df_new = df.drop(index_list)
len(df_new) = 72852
len(df) - len(index_list) = 72654

任何建议将不胜感激。

1 个答案:

答案 0 :(得分:0)

您的测试有缺陷。考虑一下index_list = [1] * 237346和索引1属于您的输入数据帧的情况。然后,您将拥有:

len(df) - len(index_list)  # 72654
len(df)                    # 100000
len(df_new)                # 99999

请确保您的index_list通过(例如)index_list = list(set(index_list))是唯一的,当然,为了进行测试排队,您应确保数据框中的索引实际上以 unique < / em>标识符。