使用CQL中提供的COPY
命令将大型csv文件导入Cassandra表时,有些字段错误输入会导致如下错误:
Bad Request: line 1:1033 no viable alternative at input ','
Aborting import at record #277561 (line 277562). Previously-inserted values still present.
277561 rows imported in 8 minutes and 20.296 seconds.
识别并修复错误输入的字段后,接下来要将csv文件的其余部分移植到表中。我能否知道是否有好的方法可以恢复先前中止的COPY,以便先前插入的行不会再次重新插入?或者,是否可以从csv文件的指定行而不是csv文件的开头执行COPY
?
答案 0 :(得分:1)
parameter list似乎没有选项来指定文件中要启动的行,因此您似乎无法指定从哪里开始。如果您认为这有用,您可以使用Cassandra JIRA报告您的问题并要求实施此类功能。
但是,这种功能似乎是多余的,您可以通过删除已知插入cassandra的数据来编辑csv文件。