如何在三表系统中插入标签

时间:2011-09-20 15:02:14

标签: php mysql sql insert database-performance

虽然像Joomla这样的一些主要系统在主文章数据库中将标记存储为逗号分隔文本,但是作为文章,标签和标签关系的三个表的规范化系统是首选(如Wordpress使用的其他系统)。关于结构和阅读的讨论和问题很多;但我无法找到最好的INSERT命令,因为我们需要插入三个表。如何通过一次SQL运行快速运行此过程?或者我们需要首先插入文章,然后是每个标签,最后写下关系?

另一个问题是关于标签的唯一性。该系统的主要优点是我们只需要存储每个术语一次(然后连接到相应的文章)。使用mysql UNIQUE避免重复是否切实可行?或者(正如我在某处读到的那样)我们需要将整个标签列表作为数组读取,以找到任何重复以捕获标签ID并避免存储该术语?

将整个过程分为三个步骤:

  1. 插入文章
  2. 使用UNIQUE INSERT标记,但不论其关系如何
  3. 查找每个标记ID并与文章ID建立关系
  4. 我是对的吗?我问的原因是我看到人们将标签作为数组捕获并进行比较。对我来说这很慢,并且会影响性​​能,特别是UPDATE。

4 个答案:

答案 0 :(得分:4)

您一次只能在一张桌子中插入。

一种解决方案是使用触发器,另一种是使用事务 第一个可以用于任何引擎,后者需要InnoDB或类似的引擎。

确保在字段UNIQUE上添加tag.name索引。

1 - 使用交易

START TRANSACTION;

INSERT IGNORE INTO tag (name) VALUES ('$example1', '$example2');
INSERT INTO article (title, body) VALUES ('$title','$body');
SET @article_id = LAST_INSERT_ID();
INSERT INTO tag_link (tag_id, article_id) 
  SELECT t.id, @article_id FROM tag t WHERE t.name IN ('$example1','$example2');

COMMIT;

2 - 在黑洞桌上使用触发器

使用以下字段创建类型为blackhole的表。

title: varchar(255)
body: text
tag1: varchar(50) DEFAULT NULL
tag2: varchar(50) DEFAULT NULL
...
add as many tags as you want.

在黑洞表中添加AFTER INSERT触发器,为您进行实际存储。

DELIMITER $$

CREATE TRIGGER ai_bh_newacticle_each AFTER INSERT ON bh_newacticle FOR EACH ROW
BEGIN
  INSERT IGNORE INTO tag (name) VALUES (new.tag1, new.tag2,...,new.tag25);
  INSERT INTO article (title, body) VALUES (new.title,new.body);
  SET @article_id = LAST_INSERT_ID();
  INSERT INTO tag_link (tag_id, article_id) 
    SELECT t.id, @article_id FROM tag t 
    WHERE t.name IN (new.tag1, new.tag2,...,new.tag25);
END$$

DELIMITER ;

DELIMITER $$

现在您只需在一个语句中插入带有标签的文章:

INSERT INTO bh_newarticle (title, body, tag1, tag2, tag3) 
  VALUES ('$title','$body','$tag1','$tag2','$tag3');

回到你的问题

  

我是对的吗?我问的原因是我看到人们将标签作为数组捕获并进行比较。对我而言,这是非常缓慢的,并且会导致性能下降,尤其是UPDATE。

标签只有在数量有限的情况下才有用。如果你在tag.name上放一个(唯一的)索引,那么即使有10.000个标签也会非常快速地查找标签。这是因为您正在寻找完全匹配。如果您真的赶时间,可以随时在memory字段上将标记表设为hash index表{。}}。 我怀疑你需要担心标签查找的缓慢。

请确保每篇文章不允许过多标签。 5似乎是一个良好的开端。 10会太多。

<强>链接
http://dev.mysql.com/doc/refman/5.0/en/create-trigger.html
http://dev.mysql.com/doc/refman/5.0/en/blackhole-storage-engine.html

答案 1 :(得分:1)

您不能在一个语句中插入3个表,但可以在一个事务中运行3个insert语句。

我没有看到将标记列声明为唯一的问题,因为您希望避免重复。您可以在将代码插入表格之前检查代码是否存在,或者更好的是simply upsert代码。

答案 2 :(得分:1)

您通过发出单个查询来运行每个INSERT,没有“解决方法”,甚至也不存在。因此,3个表格的3个插入。

如果您需要唯一标签,那么是 - 最好使用UNIQUE约束来避免重复。

简单INSERT IGNORE MySQL功能应该可以帮助您在插入之前避免记录是否存在。

答案 3 :(得分:0)

根据DBMS功能有一些可能性,即:   存储过程,而不是触发器,可以任何其他可以插入一个sql语句,但我认为它不值得,因为即使在一个事务中插入所有3个表,它不是那么重要...它是如果文章被保存但标签无法保存则不错...但是,如果需要,存储过程最适合此任务,因为它允许复杂的逻辑,并且您还可以在程序中编写子程序来执行所有sql和调用它需要在1行......

您可以在标记字段和字段上的rel表(article_id,tag)上的标记表上创建唯一索引。