“ $ path”的确切用途是什么?我只是运行“从表限制10中选择“ $ path””,在雅典娜中显示了指向数据的S3的文件路径。但是当我给出限制10时,它显示10次相同的路径,如果我不限制该语句,它将扫描整个数据。可以请别人解释一下。
答案 0 :(得分:2)
"$path"
是一个伪列,它计算给定行来自的源文件的路径。由Presto's Hive connector提供。如果您的文件包含100行,则相同的路径将获得100次。
如果要获取前十个 distinct 路径,则应尝试
select DISTINCT "$path" from table limit 10