将Alexa数据导入Amazon RedShift

时间:2013-07-21 14:17:40

标签: amazon-redshift alexa

我已经获取了每日转储文件并将其解压缩,然后将其重新放回到s3。

当我尝试在postgresql中执行复制语句时,我收到以下错误

Missing newline: Unexpected character  0x14 found at location 4

查询:

copy temp from 's3://bucket/top-1m.csv' credentials 'blah blah blah';

我是否必须为每一行添加一些角色?

原始数据:

1,facebook.com
2,google.com
3,youtube.com
4,yahoo.com
5,amazon.com
6,baidu.com
7,wikipedia.org
8,live.com

2 个答案:

答案 0 :(得分:0)

Redshift COPY命令使用PIPE' |'作为默认分隔符。 如果您的文件由另一个字符(在您的情况下为逗号)分隔,您需要做的就是将DELIMITER关键字添加到COPY命令。

copy temp from 's3://bucket/top-1m.csv' credentials 'blah blah blah' delimiter as ',';

或逗号分隔文件:

copy temp from 's3://bucket/top-1m.csv' credentials 'blah blah blah' csv;

答案 1 :(得分:-1)

从's3://bucket/top-1m.csv'凭证'复制临时'blah blah blah'delimiter',';