我有一些csv数据要导入到cassandra。这可以使用copy-command。问题是,csv没有为数据提供唯一的ID,所以我需要在导入时创建一个timeuuid。
是否可以通过copy-command执行此操作,还是需要编写外部脚本以进行导入?
答案 0 :(得分:0)
我会编写一个快速脚本来执行此操作,复制命令实际上只能处理少量数据。试试new python driver。我发现设置加载脚本的速度非常快,特别是如果在加载之前需要对数据进行任何微小的修改。
如果你有一个非常大的数据集bulk-loading仍然是可行的方法。