应用错误收集

如何将S3的最后处理文件存储到Redshift数据库

时间：2013-11-14 10:48:21

标签： bash amazon-web-services amazon-s3 amazon-redshift

目前，我已使用AWS Data Pipeline将数据从Amazon S3复制到Amazon Redshift，仅用于当前日期和时间。我想每30分钟将数据从S3复制到Redshift。最后处理的S3文件名也存储在另一个Redshift表中。

有人可以回答这个问题吗？

1 个答案:

答案 0 :(得分：2)

您可以使用RedshiftCopyActivity data pipeline object来完成此操作。 schedule对象中的RedshiftCopyActivity字段接受可以30分钟间隔运行的data pipeline schedule object。您需要定义full pipeline in JSON，包括所有AWS资源信息（Redshift数据节点，EC2实例，S3存储桶和密钥）。 JSON模板中源数据文件的文件路径可能指向一个静态文件，该文件每隔30分钟被生成数据的任何内容覆盖。

如何在用户桌面存储已处理的文件？
NodeJS文件上传到Amazon S3 Store映射到数据库
如何将S3的最后处理文件存储到Redshift数据库
存储在数据库 - Spring批处理中处理的每一行的结果
PHP存储已处理的文件
如何将日期从亚马逊s3文件加载到redshift
Redshift上个月的第一天和最后一天
如何获得＆＃34;周一至周日的最后3个月＆＃34; Redshift的约会？
Redshift存储上次访问的时间戳吗？
如何在Redshift中存储一组字符串？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？