如何处理非规范化数据的变化

时间:2016-01-01 08:25:50

标签: cassandra nosql

在包含副本的表中更新未编入索引的常规列(而非主键相关)的最佳方法是什么?

即用户发布了一些内容,并且该帖子在许多表中都是重复的,以便快速检索。但是当该帖子发生更改(使用编辑)时,需要在包含该帖子的所有表中(在具有不同和未知主键的表中)更新整个数据库。

解决方案我想:

  1. 有一个映射表来跟踪所有这些表中的主键,但它似乎导致表爆炸(post不是唯一可能更改的属性)。
  2. 使用Solr进行映射,但我担心我会将它用于错误的目的。
  3. 任何启示都将受到赞赏。

    编辑(虚构架构)。

    如果帖子发生变化怎么办?甚至是用户的display_name?

    CREATE TABLE users (
        id uuid,
    
        display_name text,
    
        PRIMARY KEY ((id))
    );
    
    CREATE TABLE posts (
        id uuid,
    
        post text,
        poster_id uuid,
        poster_display_name text
        tags set<text>,
        statistics map<int, bigint>,
    
        PRIMARY KEY ((id))
    );
    
    CREATE TABLE posts_by_user (
        user_id uuid,
        created timeuuid,
    
        post text,
        post_id uuid,
        tags set<text>,
        statistics map<int, bigint>,
    
        PRIMARY KEY ((id), created)
    );
    

1 个答案:

答案 0 :(得分:1)

这取决于更新的频率。例如,如果用户不经常更新他们的名字(每个用户帐户少数时间),那么可以使用二级索引。只要知道使用2i是一个分散集合,所以如果它是一个常见的操作,你会看到性能问题。在这些情况下,您将需要使用物化视图(3.0中的视图或自己管理)以获取给定用户的所有帖子的列表,然后更新用户的显示名称。

我建议在后台工作中执行此操作,并向用户发送一条消息,例如“可能需要[某个时间单位]才能将您名称的更改反映到任何地方”。