在阅读了有关cassandra中的墓碑和集合之后,我了解正确的方法是使用加法(+)和加法减法(-)运算符。
我读过的所有地方给人的印象是,使用此运算符而不是覆盖集合不应创建任何墓碑。
经过一些测试并读取了sstables后,似乎在进行加法操作时不会创建墓碑
但是当进行减法运算时,我会注意到sstable获得delete_info记录。此记录与删除整个单元格(而不是一组中只有一个条目)的记录不同,因此我不确定它是否是墓碑?
6545d91# sstabledump mc-23-big-Data.dbata/cs/customers-49e96fc0011f11e985316d2c86
WARN 11:17:05,402 Only 52.363GiB free across all data volumes. Consider adding more capacity to your cluster or removing obsolete snapshots
[
{
"partition" : {
"key" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
"position" : 0
},
"rows" : [
{
"type" : "row",
"position" : 143,
"clustering" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83", "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
"liveness_info" : { "tstamp" : "2018-12-16T10:47:19.434990Z" },
"cells" : [
{ "name" : "payments", "deletion_info" : { "marked_deleted" : "2018-12-16T11:00:27.524999Z", "local_delete_time" : "2018-12-16T11:00:27Z" } },
{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d81" ], "value" : "", "tstamp" : "2018-12-16T11:15:17.989Z" },
{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
"tstamp" : "2018-12-16T11:16:34.929999Z"
}
]
}
]
}
最重要的是,我的问题是一个单元格中的记录是否为墓碑? 如果可以,有可能避免吗?
{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
"tstamp" : "2018-12-16T11:16:34.929999Z"
}
答案 0 :(得分:1)
关于:
{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ],
"deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
"tstamp" : "2018-12-16T11:16:34.929999Z"
}
减法确实创建了一个逻辑删除,以向存储引擎指示集合中该元素(已移除)的状态。这样一来,删除操作优先于该路径上该元素的所有先前添加(带有时间戳的数据)。
此外,当您将整个集合作为cql语句的一部分提供时,这也会创建一个逻辑删除,这可能是该逻辑删除表示的:
{ "name" : "payments",
"deletion_info" : { "marked_deleted" : "2018-12-16T11:00:27.524999Z",
"local_delete_time" : "2018-12-16T11:00:27Z" }
}
由于Cassandra不采用先读后写,它只是为该列中的所有元素创建一个逻辑删除,以使所有可能的现有写操作无效。
如果您想完全避免墓碑,请考虑使用Frozen Collections。对于冻结的集合,您需要每次提供完整的集合值,并且集合的所有元素都存储在单个单元格中。因此,更新收藏集时无需创建逻辑删除。
使用冻结集合的明显缺点是,您必须先SELECT
添加现有内容,并在INSERT
/ {{ 1}}。缺点是您可能不得不担心管理并发写入。
或者,如果要避免使用非冻结的集合创建墓碑,则永远不要UPDATE
完整集合(即INSERT
。请使用附加元素,即INSERT INTO ks.tbl (k, c) VALUES (0, [1,2,3])
。