我正在构建审核引擎,主持人应该能够保存最后看到的消息的位置,假设总消息实体应该从100k到数百万条记录。
消息数据库结构由两个表question
和reply
组成,表示如下:
question
表:
+-------------------------+------------------+------+-----+---------------------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------------------------+------------------+------+-----+---------------------+----------------+
| entity_id | int(10) unsigned | NO | PRI | NULL | auto_increment |
| text | mediumtext | NO | | NULL | |
| customer_id | int(10) unsigned | YES | MUL | NULL | |
+-------------------------+------------------+------+-----+---------------------+----------------+
和reply
表格,parent_id
为FK
至question.entity_id
:
+-------------+------------------+------+-----+-------------------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------------+------------------+------+-----+-------------------+----------------+
| entity_id | int(10) unsigned | NO | PRI | NULL | auto_increment |
| text | mediumtext | NO | | NULL | |
| customer_id | int(10) unsigned | YES | MUL | NULL | |
| parent_id | int(10) unsigned | NO | MUL | NULL | |
+-------------+------------------+------+-----+-------------------+----------------+
SQL小提琴:http://sqlfiddle.com/#!9/a06077
因为这是两个具有父子关系的独立表,我唯一的想法是创建一个临时复合表messages
,如下所示:
问题1 - > reply1.1-> reply1.2-> reply1.3-> question2-> reply2.1-> reply2.2 ... etc
并从主持人查看的最后保存位置开始切片,假设最后保存的位置是此临时表中最后查看的消息的ID。
所以,问题是:
如果结构如下,如何正确地制作一个sql以在临时表中插入问题回复:
CREATE TEMPORARY TABLE tmp (
id INTEGER NOT NULL AUTO_INCREMENT PRIMARY KEY,
text varchar(16),
is_question boolean
);
如果正确构建此临时表,假设消息和回复将不断增长?
MySQL
)?我在大型数据库构建方面没有太多经验,并且很乐意从更有经验的工程师那里获得一些建议或评论或有关此任务的任何想法。
答案 0 :(得分:0)
如果有人说要花20分钟并展示它,这是我的建议。
create database QRMod123xyz; -- create a new safe sandbox away from your tables
use QRMod123xyz; -- use this db
drop table if exists reply; -- reverse order on drop (at least for the FK ones at the moment)
drop table if exists question; -- this comes second
drop table if exists moderator_qr_seen_history;
create table question
( question_id int auto_increment key primary key,
theText mediumtext, -- don't use reserved or keywords for column names
customer_id int
-- dont forget useful indexes and FK to customer table
)engine=INNODB;
create table reply
( reply_id int auto_increment key,
theText mediumtext,
question_id int not null,
sequence_id int not null, -- sequence of read (1..n) per question_id. See notes at bottom.
customer_id int not null, -- could be more than 1 customer for a given question id in theory
theDT datetime not null,
unique key (question_id,sequence_id),
constraint fk_question foreign key (`question_id`) references question(`question_id`)
-- dont forget useful indexes and FK to customer table
)engine=INNODB;
create table moderator_qr_seen_history
( -- modify this to your heart's content depending on your intentions
id int auto_increment primary key,
question_id int not null,
reply_id int not null,
moderator_id int not null,
theText mediumtext,
customer_id int not null,
theDT datetime not null, -- when seen (note, a moderator can have several rows for a "Q R" combo
key(question_id,moderator_id) -- NOTE Aboy this will narrow things down (big time filter)
-- dont forget useful indexes and all FK's
)engine=INNODB;
... do other stuff (save your scripts !)
drop database QRMod123xyz; -- cleanup when complete
注意A(上面的参考):该密钥将使用大时间过滤器缩小范围。不过,它不会成为覆盖指数。这只是一个想法。只有经过充分的测试,您才能知道 指数策略应该是什么。
另见Keywords and Reserved Words。不要在列名中使用它们。
我不会使用临时表。
我会在sequence_id
表格中获取question
包含FOR UPDATE锁的事件,作为获取该问题的下一个可用序列的途径(来自{{ 1}}。使用下一个增加的可用数字插入回复。然后ifnull(max(sequence_id),0)
。
在一个简单的案例中,ifnull max的快速视觉效果如下。但是你可以使用适当的COMMIT
子句对reply
表使用它。注意,这支持规范化和事务,安全性。
where
这是我在20分钟内给你的最好的。