标签: hadoop parquet
我听说有人建议仅在提取数据集的某些列时使用Parquet格式文件(由于其列存储格式)。
但是如何获取所有列呢?如果我有一个结构化的数据集保存在hdfs的镶木地板文件中,并且想获取所有列,那么使用镶木地板文件有什么好处吗?