我想使用S3存储桶在雅典娜中创建一个表,但是首先我想知道是否有任何方法可以将子目录的名称(文件的源数据)作为新的列。表。如果是这样,我应该使用哪种语法?如果这不可能,那么我至少需要在该新列中添加文件的路径。
Power BI中的映射需要子目录名称。
提前谢谢!
答案 0 :(得分:0)
来自Find the Source File for an Athena Table Row:
- 要找出哪个Amazon S3文件包含Athena表中特定行返回的数据,请运行
mutable
查询。- 要找出哪些Athena表行与特定的Amazon S3文件相关联,请使用
SELECT $path
条件运行SELECT查询。
来自CREATE EXTERNAL TABLE - Amazon Redshift:
默认情况下,Amazon Redshift使用伪列
WHERE $path
和$path
创建外部表。选择这些列以查看Amazon S3上数据文件的路径以及查询返回的每一行的数据文件大小。$size
和$path
列名必须用双引号引起来。$size
子句不返回伪列。您必须在查询中明确包含SELECT *
和$path
列名,如以下示例所示:
$size