SQL - 当多个左连接时返回的重复标记

时间:2014-08-11 12:14:05

标签: mysql sql join tags left-join

我正在预订,多个链接的标签和客户都附在该预订中。

存在两个中间表来跟踪其他表之间的关联:tag_assocs(在本例中)和bookings表之间的tags以及assocs之间的关联bookingscustomers表。

SQL(简化):

SELECT
    bookings.id,
    GROUP_CONCAT(tag SEPARATOR "|") AS tags,
    GROUP_CONCAT(customers.id SEPARATOR "|") AS customer_id
FROM bookings
LEFT JOIN tag_assocs ON tag_assocs.item_id = bookings.id && tag_assocs.item_type = "bookings"
LEFT JOIN tags ON tags.id = tag_assocs.tag_id
LEFT JOIN assocs ON assocs.item_id = bookings.id && assocs.item_type = "bookings.customer_id"
LEFT JOIN customers ON customers.id = assocs.foreign_item_id
WHERE bookings.id = "a64l_ku-4af"
GROUP BY bookings.id
ORDER BY bookings.modified desc
LIMIT 20

现在,有问题的预订(a64l_ku-4af)只有一个标签 - 在数据库中确认。也就是说,tag_assocs标记some-tag只有一个条目。实际上,这是通过阻止重复的唯一索引来实现的。但它又回来了两次,即

--------------------
| tags             |
--------------------
| some-tag|some-tag|
--------------------

由两部分组成的问题:

1)为什么会这样?

2)我可以通过将GROUP_CONCAT(tag ...更改为GROUP_CONCAT(DISTINCT tag ...)来解决此问题,但我觉得这是一个黑客攻击并且没有解决问题的原因。

1 个答案:

答案 0 :(得分:2)

让我们用一个例子来解释。假设我们有以下表格:

第1部分:原始查询

表格书:

id | book
------------
 1 | Book 1
 2 | Book 2

表格标签:

id | tag
-----------
 1 | Hobby
 2 | Sport
 3 | Work

Table books2tags(用于标记带有适当标签的书籍):

book_id | tag_id
----------------
      1 |     1
      1 |     2
      2 |     2
      2 |     3

现在这两本书都附加了两个标签,结果是

SELECT b.book, t.tag FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id

就是这样(订单无关紧要):

book   | tag
---------------
book 1 | Hobby
book 1 | Sport
book 2 | Sport
book 2 | Work

要获得包含每本书的标签列表的字符串,我们使用

SELECT b.book, GROUP_CONCAT(t.tag SEPARATOR '|') as tags FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
GROUP BY b.book

,结果可能是:

book   | tags
---------------------
book 1 | Hobby|Sport
book 2 | Work|Sport

第2部分:加入另一张表

如果我们有另一个包含可选附加信息的表,那么举个例子说明:

id | book_id | example
-------------------------------------
 1 |      1  | 'example information'
 2 |      2  | 'another example'

我们通过LEFT JOIN得到这些附加信息:

SELECT b.book, t.tag, e.example FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
LEFT JOIN example e ON b.id = e.book_id

结果将是:

book   | tag     | example
----------------------------
book 1 | Hobby   | example information
book 1 | Hobby   | another example
book 1 | Sport   | example information
book 1 | Sport   | another example
book 2 | Sport   | NULL
book 2 | Work    | NULL

您会看到我们原始查询中第1册的每一行与结果中的行相同,因为我们新加入的表示例中存在匹配的行。如果我们使用旧的查询按书籍获取标记,但添加了左边的连接,我们将通过

SELECT b.book, GROUP_CONCAT(t.tag SEPARATOR '|') as tags FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
LEFT JOIN example e ON b.id = e.book_id
GROUP BY b.book

book   | tags
---------------------
book 1 | Hobby|Hobby|Sport|Sport
book 2 | Work|Sport

那是因为有两行标有'Hobby'标签,两行标有'Sport'标签。但是为了获得标签列表,我们通过使用DISTINCT获得了正确的结果。那不是黑客:

SELECT b.book, GROUP_CONCAT(DISTINCT t.tag SEPARATOR '|') as tags FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
LEFT JOIN example e ON b.id = e.book_id
GROUP BY b.book

book   | tags
---------------------
book 1 | Hobby|Sport
book 2 | Work|Sport

<强>结论

我想我已经说明了为什么标签可以通过加入另一个表作为问题第1部分的答案来复制,并且可以向您保证您的解决方案不是黑客,但实际上是解决此问题的正确解决方案。

也请查看 this demo