使用Cassandra评估最小存储磁盘大小

时间:2016-08-27 12:48:02

标签: cassandra apache-spark-sql

我正在执行不同Parquet模式和不同Cassandra表格布局之间的分析/比较。

其中一个输出是磁盘上的存储大小。

我想确保我对Cassandra公平,所以我想确保删除快照并且“完全”运行压缩。

我的数据最初是在Parquet中,我用Spark SQL读取它,有一个大数据框,然后我使用Spark-Cassandra Connector写入C *。

我应该运行什么类型的“命令”(我假设TypeError: unsupported operand type(s) for +: 'NoneType' and 'str' )删除快照,运行压缩然后获取表格磁盘大小的精确数字?

1 个答案:

答案 0 :(得分:1)

您必须执行nodetool clearsnapshot

此命令仅删除nodetool命令指向的节点中的快照。所以你必须在每个节点上都这样做。

https://docs.datastax.com/en/cassandra/3.x/cassandra/tools/toolsClearSnapShot.html

https://docs.datastax.com/en/cassandra/3.x/cassandra/operations/opsBackupDeleteSnapshot.html?hl=clearsnapshot