我正在通过Wes McKinney的新版Python for Data Analysis和pg。他在第8章中指出,如果索引按字典顺序从最外层开始排序,那么大熊猫中的数据选择性能在分层索引对象(例如,数据帧)上“要好得多”。
换句话说,在此数据框上选择数据:
key1 key2 col1
1 a 11
b 12
2 a 13
b 14
...比这个数据框中的数据选择“好得多”:
key1 key2 col1
1 a 11
2 a 13
1 b 12
2 b 14
Wes没有对此声明作出解释。
拜托,请有人向我解释:
为什么第一个数据帧上的数据选择“比”更好“ 第二个数据帧?换句话说,为什么要选择数据 具有分层索引的数据帧“更好”的时候 数据帧从最外层开始按字典顺序排序 水平?
在这种情况下,“更好”意味着什么?快点?更多的记忆 有效?还有别的吗?