我正在读取一个csv文件来创建一个熊猫数据框,然后从该数据框创建一个bcolz ctable。由于某种原因,ctable的未压缩大小(ctable.nbytes)明显大于压缩后的大小(ctable.cbytes)。
我以为我的数据可能不是压缩的理想选择,所以我创建了一个csv进行测试,其中一半的行每列中大多数包含0,另一半的行中大多数包含1。仍然存在相同的问题。
我还将压缩级别设置为无效数字,这应该引发异常,但不是。就像根本没有压缩数据一样。
由于该示例依赖于特定的csv文件,因此我在github上创建了该示例:https://github.com/danbritt/bcolz-test
根据我在文档中阅读的内容并通过阅读一些教程,应该进行一定程度的压缩,其中ctable.cbytes小于ctable.nbytes。
任何可能发生的情况的见解都会很有帮助。