如果csv文件中有多个记录,则从CSV导入失败

时间:2014-09-29 08:35:06

标签: sql csv cassandra etl nosql

如果csv文件中有多个记录,则从CSV导入失败,在此sample file中,数据由单个空格ASCII值分隔。问题是每个记录都有单个空格'即使在最后一列值之后,现在当系统遇到最后一个单一空间时,在每一行..它假设为另一个列值而不是向前移动到下一个记录(因为它无法找到新行字符)。

是否指定在每行中的最后一列值之后忽略单个空格? 有什么方法可以将每一行的最后一个单独空格视为换行符吗?

我有几千行,所以不可能用一些行尾字符手动替换最后一个空格ASCII值?

另外注意任何好的ETL工具可以帮助轻松地将原始数据移动到Cassandra以避免上述类型的问题?

错误消息

$COPY sensors_data(samplenumber,magx,magy,magz,accx,accy,accz,gyror,gyrop,gyroy,lbutton,rbutton) FROM '/home/swift/cassandra/input-data/FallFromDesk1.csv' WITH DELIMITER=' ';
Record #0 (line 1) has the wrong number of fields (13 instead of 12).

注意 如果.csv文件中只有一行,或者我们手动删除每行上最后一列值后的单个空格,则上述命令可以正常工作。

请帮助我。

0 个答案:

没有答案