Parquet自2018年以来就拥有Column Indexes,但是我似乎找不到任何利用Parquet的列索引来过滤出行并仅将满足某些条件(或谓词)的行装载到熊猫中的程序包?< / p>
有没有办法“利用”镶木地板列索引?在pandas.read_parquet(..., index_columns = [value1, value2])
等中
答案 0 :(得分:1)
列索引功能于2018年实现,但尚未发布。在您链接的JIRA中,您可以看到该修补程序版本设置为1.11.0,但是截至2019年10月the latest release is 1.10.1。