如何使用复制命令从amazon s3 bucket excel文件加载redshift表?

时间:2016-12-22 07:23:38

标签: amazon-web-services amazon-s3 amazon-redshift

在我的S3存储桶中,我有.xls文件(这个文件是分组文件,我的意思是前20行有一些图像和一些关于客户端的提取细节)。

首先,我想将.xls转换为.csv,然后通过复制命令加载Redshift表,并忽略前20行。

注意:我手动将.xls另存为.csv然后我尝试加载Redshift 通过复制命令成功加载表。现在我的问题是 如何通过Pentaho工作将.xls转换为.csv。

1 个答案:

答案 0 :(得分:0)

您只需使用两个步骤即可将excel转换为csv:

  1. Microsoft Excel输入 - 它应该从您的Excel文件中读取行
  2. 文本文件输出 - 它将步骤1中的行保存到csv文件
  3. enter image description here