Cassandra - 按ID分组和按日期排序

时间:2018-04-06 02:02:04

标签: database cassandra nosql data-modeling cql

我的应用程序的一部分由讨论板组成:有线程,帖子和类别。线程按类别分组,帖子按线程分组。我在提出一个模型/查询时遇到问题,该模型/查询将允许按类别选择线程,并按其最后一个帖子的降序排列。

分类

CREATE TABLE keyspace.categories (
    id ascii PRIMARY KEY,
    description text,
    name text,
    ...
);

主题

CREATE TABLE keyspace.threads (
    id ascii PRIMARY KEY,
    category_id ascii,
    content text,
    ...
);

发布

CREATE TABLE keyspace.posts (
    thread_id ascii,
    created_at timestamp,
    id ascii,
    content text,
    ...
    PRIMARY KEY (thread_id, created_at, id)
);

我最初想过把最后一篇文章""创建于"时间作为线程表上的聚类键,但随着每个帖子的变化,这是不可能的。

然后我考虑创建一个中间表,每次创建一个帖子时都会写入该表。这解决了第一种方法的不变性问题,但问题是它将包含每个线程的多个值,并且我无法找出支持按线程分组和按日期排序的分区/集群顺序。

例如,以下内容允许我按线程分组,但不按日期排序:

CREATE TABLE last_post_for_category (
    category_id ascii,
    thread_id ascii,
    created_at timestamp,
    PRIMARY KEY ((category_id), thread_id, created_at)
) WITH CLUSTERING ORDER BY (thread_id DESC, created_at DESC);

SELECT thread_id FROM last_post_for_category WHERE category_id = 'category' GROUP BY thread_id, created_at;

以下内容允许我按日期排序,但不按线程分组:

CREATE TABLE keyspace.last_post_for_category (
    category_id ascii,
    thread_id ascii,
    created_at timestamp,
    PRIMARY KEY ((category_id), created_at, thread_id)
) WITH CLUSTERING ORDER BY (created_at DESC, thread_id DESC);

SELECT thread_id FROM last_post_for_category WHERE category_id = 'category' GROUP BY created_at, thread_id;

我无法在distinct上执行(category_id, thread_id),因为我对此查询执行时的线程ID一无所知。

有没有人知道如何才能最好地代表这种排序?

1 个答案:

答案 0 :(得分:1)

首先,我建议您使用数据类型datetime而不是timestamp,因为它可以让您轻松修改或设置默认值。这只是一个建议。

建议的解决方案:

将属性last_post添加到表threads以节省每个帖子中最后添加的帖子的时间。
首次创建线程时,last_post值应该等于一个非常旧的日期(因为该线程中还没有帖子)。

创建触发器后,只要在posts中插入帖子,触发器就会更新相应线程的last_post值。可以像这样添加触发器:

CREATE TRIGGER triggerName ON posts
FOR INSERT
AS
declare @post_time datetime;
declare @thread_id int;
select @post_time=i.created_at from inserted i;
select @thread_id=i.thread_id from inserted i;

update threads set lastpost = @post_time where id=@thread_id  
GO

最后一步是直接查询按类别按last_post排序选择线程,如下所示:

select * from threads where category_id = 'theCategoryYouWant' order by lastpost asc /*or desc as you like*/  

注意:如果您希望在编辑帖子时更新created_at,则需要添加类似的触发器来更新相应线程的last_post属性