标签: python pandas csv
CSV是一种面向行的存储格式。 pandas文档说,使用COMPUTE_FRAMES方法中的usecols参数减少要读取的列数比读取整个文件要快。在面向行的存储文件中,例如面向行的关系数据库,即使选择列的子集,也可以读取整行。现在这可能会导致内存使用率降低,但是由于磁盘查找时间仍应保持不变,这又如何导致解析时间缩短?
COMPUTE_FRAMES
usecols