我有3个表:产品,类别和pro_cat_link。可以通过表pro_cat_link将产品链接到一个或多个类别。
我的查询必须回答以下问题:查找与一组类别匹配的所有产品。例如:找到所有的产品,包括黄色,水果和甜味"。
在SO中研究这个问题时,我只能找到我目前正在使用的解决方案: Complicated SQL Query--finding items matching multiple different foreign keys
在我的情况下,我的查询如下所示:
SELECT products.id, COUNT(DISTINCT categories.id) as countCat
FROM products
INNER JOIN pro_cat_link ON (pro_cat_link.product_id = products.id)
WHERE pro_cat_link.category_id IN (3,6,8,10)
GROUP BY product.id
ORDER BY product.date DESC
HAVING countCat = 4
换句话说,选择与类别ID之一匹配的所有产品(3,6,8,10),并仅保留恰好有4个类别匹配的产品。
这很有效,但我遇到了性能问题,因为COUNT(),GROUP BY,ORDER BY使得正确的索引非常有限。谁能想到一个更好的方法来解决这个问题?
答案 0 :(得分:2)
如果您将信息存储在某处,则可以消除分组和计数的性能问题。您可以在名为total_categories
的商品中添加一列,告诉您产品参与的类别数量。然后您可以说where total_categories = 4
。如果产品经常更改其类别,则可能更难以维护,因为您必须不断更新此字段 - 然后您必须决定是否要在应用程序代码或触发器或存储过程中执行此操作...
通常情况下,我不认为将这些元数据直接存储在表中是个好主意,但如果性能真的那么糟糕,那么可能值得考虑。
答案 1 :(得分:1)
如果您没有太多类别,而不是跟踪列数,则可以使用表示其所在类别的位串(即位置i处的1表示产品属于类别i, 0表示不属于该类别)。然后,当搜索一组类别时,为该搜索生成一个位串,并AND
使用该字符串的所有类别字符串。正确类别中的那些将生成搜索字符串作为答案。
例如,假设您有十个类别。 Item1属于1, 3, 5, 6, 8, 10
类别,因此其类别字符串为1010110101
。 Item2属于1, 2, 4, 6, 8, 10
类别,因此其类别字符串为1010101011
。搜索3,6,8和10时,您将生成字符串s = 1010100100
。 Item1 & s = 1010100100 = s
。 Item2 & s = 1010100000 <> s
。
此外,您不必将其存储为字符串,您可以将其存储为实际的10等效基数。所以Item1,Item2和s分别是693,683和676。 693 & 676 = 676
,但683 & 676 = 672
。然后,如果您要将产品添加到类别i,只需将其类别编号更新为2 ^(i - 1),如果您要从类别i中删除,则只需减去2 ^(i - 1)。
当然,如果你在MySQL int中有更多的类别而不是位,那么这根本不起作用。另外,正如FrustratedWithFormsDes在他的回答中指出的那样,这会调用更新pro_cat_link和这个表的所有问题(当然,这取决于pro_cat_link用于什么,这可能完全消除它)。此外,如果某个类别更改了数字,则必须更新所有内容。