什么是$ path伪列?在雅典娜(Presto)中有什么用?

时间:2019-02-12 20:55:05

标签: amazon-athena presto

“ $ path”的确切用途是什么?我只是运行“从表限制10中选择“ $ path””,在雅典娜中显示了指向数据的S3的文件路径。但是当我给出限制10时,它显示10次相同的路径,如果我不限制该语句,它将扫描整个数据。可以请别人解释一下。

1 个答案:

答案 0 :(得分:2)

"$path"是一个伪列,它计算给定行来自的源文件的路径。由Presto's Hive connector提供。如果您的文件包含100行,则相同的路径将获得100次。

如果要获取前十个 distinct 路径,则应尝试

select DISTINCT "$path" from table limit 10