为什么数字选择性能在按字典顺序排序的数据帧上“更好”?

时间:2018-02-27 16:07:57

标签: python pandas dataframe

我正在通过Wes McKinney的新版Python for Data Analysis和pg。他在第8章中指出,如果索引按字典顺序从最外层开始排序,那么大熊猫中的数据选择性能在分层索引对象(例如,数据帧)上“要好得多”。

换句话说,在此数据框上选择数据:

key1 key2 col1
1    a    11
     b    12
2    a    13
     b    14

...比这个数据框中的数据选择“好得多”:

key1 key2 col1
1    a    11
2    a    13
1    b    12
2    b    14

Wes没有对此声明作出解释。

拜托,请有人向我解释:

  1. 为什么第一个数据帧上的数据选择“比”更好“ 第二个数据帧?换句话说,为什么要选择数据 具有分层索引的数据帧“更好”的时候 数据帧从最外层开始按字典顺序排序 水平?

  2. 在这种情况下,“更好”意味着什么?快点?更多的记忆 有效?还有别的吗?

0 个答案:

没有答案