标签: amazon-web-services apache-spark amazon-s3 parquet amazon-athena
答案 0 :(得分:2)
是的,Parquet文件是可拆分的。
S3支持定位读取(范围请求),该读取可用于仅读取输入文件(对象)的选定部分。
答案 1 :(得分:0)
我不是100%地确定您的意思,但通常(我认为)是,您在分区键上有实木复合地板分区并将列保存到行块中。当我在其中使用过AWS S3时,它的保存方式如下:
<DataGrid Name="dg" EnableRowVirtualization="False"> ...
这可以处理您提到的拆分效率。