可能是我错过了一些东西但是我无法理解如果我使用quicksight直接通过S3直接连接athena会得到什么好处。请帮我理解这一点。
答案 0 :(得分:4)
Amazon S3是一个用于存储和检索任意数量数据的对象存储。基本上,它有一些原始数据或非结构化数据(以某种文件格式.csv
或.tsv
)。
Amazon Athena使用托管数据目录来存储信息和 有关为数据创建的数据库和表的模式 存储在Amazon S3中。因此,Athena了解数据及其结构 (即某些架构)在S3中。
此外,QuickSight可以直接连接到Athena数据库并查询数据进行分析。当您连接到Athena数据库时,您最有可能处理结构化或半结构化数据。
当数据源是Amazon Athena时,不需要Amazon S3清单文件。
直接连接到S3时的一些限制: -
清单中指定的文件大小不能超过1 GB 指定的所有文件的大小不能超过10 GB,总数 指定的文件数量不能超过1000个。
使用Amazon Athena Data创建数据集时,上述限制不可用。
使用亚马逊雅典娜数据创建数据集时的另一个功能: -
您可以直接分析数据而无需加载或加载到SPICE中 并分析数据。
<强>结论: - 强>
如果您没有对S3文件进行任何操作,您可以使用S3作为数据集使用QuickSight。
如果您已将S3数据加载到Athena,则可以使用Athena作为QuickSight的数据集。
通过使用Athena或任何其他数据源,您将获得一些好处,并且可以克服上面提到的某些限制(即文件大小)。