标签: python pandas performance
我正在尝试了解熊猫和切片的一些内部原理。假设我有一个消耗1GB内存的DataFrame。如果我执行df[df['foo'].isna()],我是否会根据空行数获取全部内存?还是仅仅是足够的内存来引用原始DataFrame中的行?
df[df['foo'].isna()]
示例:如果DataFrame中的所有行都缺少foo的值,我的内存命中数是否会达到2GB以完成/保留.isna()的结果?还是仅仅将对原始DataFrame的引用存储到1.05GB左右呢?
foo
.isna()