Spark-无法计算字符串列的实木复合地板最小/最大统计量

时间:2018-10-14 04:18:59

标签: apache-spark parquet

我为火花作业启用了“ spark.parquet.strings.signed-min-max.enabled”属性。在检查最小/最大镶木地板统计数据时,不会为镶木地板数据的字符串列计算或显示静态统计数据。

对于字符串列,我看到以下内容。 VLE:主要词典ST:[此列无统计信息]

我使用以下命令检查统计信息:

hadoop jar parquet-tools-1.9.0.jar dump -d -n 

是否可以为字符串列启用统计信息?如果是这样,是否应该更改任何配置或编码? 欢迎任何建议。谢谢。

0 个答案:

没有答案