我为火花作业启用了“ spark.parquet.strings.signed-min-max.enabled”属性。在检查最小/最大镶木地板统计数据时,不会为镶木地板数据的字符串列计算或显示静态统计数据。
对于字符串列,我看到以下内容。 VLE:主要词典ST:[此列无统计信息]
我使用以下命令检查统计信息:
hadoop jar parquet-tools-1.9.0.jar dump -d -n
是否可以为字符串列启用统计信息?如果是这样,是否应该更改任何配置或编码? 欢迎任何建议。谢谢。