我需要最快的性能方式来检索需要快速提升的整数。这是我的用例:我的网站上有一个“排序/过滤器”选项。我有狗的属性,例如长发,短发,大狗等。我希望用户能够按狗的属性进行过滤。
这是我的桌子:
dogs
- id
- attributes
这里是关于狗的属性的引用(对这个问题不是很重要,只是给你一个主意):
0 = adoptable pet
1 = short hair
2 = long hair
3 = fluffy
4 = black
5 = brown
6 = white
7 = golden/yellow
8 = etc...
现在,我具有以TEXT
数据类型保存为JSON格式的属性。例如,["0","4"]
或["0"]
或["2"]
。
所以我想选择所有属性,如下所示:
SELECT * FROM dogs WHERE attributes LIKE %0% OR attributes LIKE %1% OR attributes LIKE %4% attributes LIKE %7%
如何选择属性包含0或1或4或7(非和)的所有行。如果某行具有这些属性之一,请选择它们。
处理它的最佳方法是什么?我应该将JSON数据类型存储在MySQL中还是应该做其他事情?我希望能够SELECT
并将其快速拉起。我觉得LIKE
的使用方式不会很快。
最好的和最快的方法是什么,尤其是成千上万行到数百万行?
谢谢你!
答案 0 :(得分:3)
用逗号分隔的列表是一个有问题的反模式。 (Bill Karwin在他的《 SQL AntiPatterns:避免数据库编程的陷阱》一书中作了精彩的演讲,因此,我不会深入讨论为什么我们希望避免这种情况。相反,我将跳入一个经过验证的通常用于实现多值属性的模式。)
规范关系模式将创建一个在每行上具有单个属性的表。例如这样的东西:
CREATE TABLE dog_attribute
( dog_id int not null comment 'fk ref dog.id'
, attr int not null comment '1=adoptable, 2=...'
, PRIMARY KEY (dog_id, attr)
, CONSTRAINT FK_dog_attribute_dog FOREIGN KEY dog_id REFERENCES dog (id)
ON UPDATE CASCADE ON DELETE CASCADE
, UNIQUE KEY dog_attribute_UX (attr, dog_id)
);
-
要为给定的dog_id添加三个属性,我们添加三行:
INSERT INTO dog_attibute (dog_id, attr) VALUES
(1,2)
,(1,3)
,(1,5)
-
有几种可能的查询模式。举几个简单的例子:
要查找同时具有属性2和属性3的dog_id,我们可以这样做:
SELECT da.dog_id
FROM dog_attribute da
WHERE da.attr IN (2,3)
GROUP
BY da.dog_id
HAVING COUNT(1) = 2
还有其他查询模式可以给出相同的结果,例如
SELECT da.dog_id
FROM dog_attribute da
JOIN dog_attribute dd
ON dd.dog_id = da.dog_id
AND dd.attr = 3
WHERE da.attr = 2
可以扩展第一个查询模式,以查找具有至少一组给定属性的dog_id。例如
WHERE da.attr IN (2,3,5,7)
HAVING COUNT(1) >= 2
第二个查询可以扩展为单个属性添加联接和反联接
-
要查找具有属性2,具有属性3和4之一(或两者都有)而又没有属性7或8的行,我们可以执行以下操作:
SELECT da.dog_id
FROM dog_attribute da
LEFT
JOIN dog_attribute dn
ON dn.dog_id = da.dog_id
AND dn.attr IN (7,8)
WHERE dn.dog_id IS NULL
AND da.attr = 2
AND EXISTS ( SELECT 1
FROM dog_attribute de
WHERE de.dog_id = da.dog_id
AND de.attr IN (3,4)
)
(通过反联接排除具有属性7的dog_id ...)
如果我不能实现上面演示的表模式,...如果我绝对必须使用逗号分隔的列表,以将多个属性保存在单个列中...则需要一个小的静态属性集(在表定义,而不是动态添加或删除),我将使用MySQL SET
数据类型。
https://dev.mysql.com/doc/refman/8.0/en/set.html
attributes SET('','adoptable','short hair','long hair','fluffy','black','brown','white','golden')
并对此进行查询,我们可以这样做:
WHERE FIND_IN_SET('black',t.attributes)
AND FIND_IN_SET('long hair',t.attributes)