填充Cassandra数据库的最佳方法

时间:2020-08-31 18:30:13

标签: cassandra

我正在寻找使用自定义表预填充cassandra数据库的最佳方法。 除了使用cassandra-stress之外,是否有任何方法可以插入100GB的数据? 这仅用于POC,没有实际数据。 我要实现的是拥有2个数据集,一个具有50GB的数据,另一个具有100GB。

它可以是伪数据。

谢谢!

1 个答案:

答案 0 :(得分:0)

除了cassandra-stress之外,还有更好的工具:

  • NoSQLBench-最初是在DataStax内部开发的用于负载测试的工具,现已开放源代码。它非常灵活且性能出色。它包括几个可以使用的内置工作负载
  • tlp-stress-提供了多个内置工作负载,并且性能也很高。

在两种情况下,磁盘上数据的大小将取决于数据本身-因为数据是压缩的,所以它取决于数据结构的压缩程度。