根据this AWS documentation,似乎AWS S3不支持清单文件中的拼花格式,但是我很难相信,因为这是使用的一种非常常见的文件格式,并且应该用于Athena / Redshift从我所了解的木地板格式。这是另一份文档,其中引用了与Redshift和镶木地板文件格式有关的S3清单文件,但我不太确定它的确切含义是https://docs.aws.amazon.com/redshift/latest/dg/loading-data-files-using-manifest.html。
我只是想使用我的一个S3存储桶中的某些镶木地板文件在Amazon QuickSight中创建数据集。我尝试省略清单中的globalUploadSettings字段,并且能够提取数据,但是QuickSight不知道它是哪种文件类型,因此只显示带有一串字符的信息。
我当前拥有的清单:
{
"fileLocations": [
{
"URIPrefixes": [
"https://s3.amazonaws.com/myBucket/myFolderWithData/"
]
}
]
}
答案 0 :(得分:1)
AWS S3在清单文件中不支持拼花格式,但是您可以将Athena用作数据集来支持拼花格式。
导入文件数据
您可以将Amazon S3或本地(本地)网络上的文件用作数据源。 QuickSight支持以下格式的文件:
CSV and TSV – Comma-delimited and tab-delimited text files
ELF and CLF – Extended and common log format files
JSON – Flat or semistructured data files
XLSX – Microsoft Excel files
QuickSight支持UTF-8文件编码,但不支持UTF-8(带有BOM)。
Amazon S3中已用zip或gzip(www.gzip.org ),可以原样导入。如果您对Amazon S3中的文件使用了另一个压缩程序,或者这些文件位于您的本地网络中,请在导入文件之前先删除压缩。
https://docs.aws.amazon.com/quicksight/latest/user/supported-data-sources.html