我正在执行不同Parquet模式和不同Cassandra表格布局之间的分析/比较。
其中一个输出是磁盘上的存储大小。
我想确保我对Cassandra公平,所以我想确保删除快照并且“完全”运行压缩。
我的数据最初是在Parquet中,我用Spark SQL读取它,有一个大数据框,然后我使用Spark-Cassandra Connector写入C *。
我应该运行什么类型的“命令”(我假设TypeError: unsupported operand type(s) for +: 'NoneType' and 'str'
)删除快照,运行压缩然后获取表格磁盘大小的精确数字?
答案 0 :(得分:1)
您必须执行nodetool clearsnapshot
。
此命令仅删除nodetool
命令指向的节点中的快照。所以你必须在每个节点上都这样做。
https://docs.datastax.com/en/cassandra/3.x/cassandra/tools/toolsClearSnapShot.html