从cassandra集合中减去(-)是否创建了墓碑?

时间:2018-12-16 11:34:22

标签: cassandra

在阅读了有关cassandra中的墓碑和集合之后,我了解正确的方法是使用加法(+)和加法减法(-)运算符。

我读过的所有地方给人的印象是,使用此运算符而不是覆盖集合不应创建任何墓碑。

经过一些测试并读取了sstables后,似乎在进行加法操作时不会创建墓碑

但是当进行减法运算时,我会注意到sstable获得delete_info记录。此记录与删除整个单元格(而不是一组中只有一个条目)的记录不同,因此我不确定它是否是墓碑?

6545d91# sstabledump mc-23-big-Data.dbata/cs/customers-49e96fc0011f11e985316d2c86
WARN  11:17:05,402 Only 52.363GiB free across all data volumes. Consider adding more capacity to your cluster or removing obsolete snapshots
[
  {
    "partition" : {
      "key" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
      "position" : 0
    },
    "rows" : [
      {
        "type" : "row",
        "position" : 143,
        "clustering" : [ "da8b9f4e-b063-4254-aee6-acba55b35d83", "da8b9f4e-b063-4254-aee6-acba55b35d83" ],
        "liveness_info" : { "tstamp" : "2018-12-16T10:47:19.434990Z" },
        "cells" : [
          { "name" : "payments", "deletion_info" : { "marked_deleted" : "2018-12-16T11:00:27.524999Z", "local_delete_time" : "2018-12-16T11:00:27Z" } },
          { "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d81" ], "value" : "", "tstamp" : "2018-12-16T11:15:17.989Z" },
          { "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
            "tstamp" : "2018-12-16T11:16:34.929999Z"
          }
        ]
      }
    ]
  }

最重要的是,我的问题是一个单元格中的记录是否为墓碑? 如果可以,有可能避免吗?

 { "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ], "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
            "tstamp" : "2018-12-16T11:16:34.929999Z"
  }

1 个答案:

答案 0 :(得分:1)

关于:

{ "name" : "payments", "path" : [ "da8b9f4e-b063-4254-aee6-acba55b35d82" ],
  "deletion_info" : { "local_delete_time" : "2018-12-16T11:16:34Z" },
  "tstamp" : "2018-12-16T11:16:34.929999Z"
}

减法确实创建了一个逻辑删除,以向存储引擎指示集合中该元素(已移除)的状态。这样一来,删除操作优先于该路径上该元素的所有先前添加(带有时间戳的数据)。

此外,当您将整个集合作为cql语句的一部分提供时,这也会创建一个逻辑删除,这可能是该逻辑删除表示的:

{ "name" : "payments", 
  "deletion_info" : { "marked_deleted" : "2018-12-16T11:00:27.524999Z",
  "local_delete_time" : "2018-12-16T11:00:27Z" } 
}

由于Cassandra不采用先读后写,它只是为该列中的所有元素创建一个逻辑删除,以使所有可能的现有写操作无效。

如果您想完全避免墓碑,请考虑使用Frozen Collections。对于冻结的集合,您需要每次提供完整的集合值,并且集合的所有元素都存储在单个单元格中。因此,更新收藏集时无需创建逻辑删除。

使用冻结集合的明显缺点是,您必须先SELECT添加现有内容,并在INSERT / {{ 1}}。缺点是您可能不得不担心管理并发写入。

或者,如果要避免使用非冻结的集合创建墓碑,则永​​远不要UPDATE完整集合(即INSERT。请使用附加元素,即INSERT INTO ks.tbl (k, c) VALUES (0, [1,2,3])