我是Cassandra的新手,我正在努力解决一些概念。我看到在多个表(使用不同的分区键)中复制相同数据以支持查询的优势,但ETL作业通常是如何设置的?
考虑一个场景,其中来自单个csv文件的数据必须加载到多个表。我们应该多次使用csv文件运行copy / sstableloader / cassandra-loader实用程序,每个表一次吗?
当数据部分加载到某些表但加载脚本仍在运行时,如何保持读取一致性?连接到两个不同表的客户端可能会读取两个不同的值。一些在线论坛建议使用物化视图。这是唯一的选择吗?
谢谢!