可以在类型为字符串数组的列上创建索引。尝试使用 GIN索引。但查询似乎没有使用这些索引。
Example
CREATE TABLE users (
name VARCHAR(100),
groups text[],
);
Query: SELECT name FROM users WHERE ANY(groups) = 'Engineering'.
同样有效地在'groups'列上执行GROUP BY的最佳方法是什么,以便它可以给'组'和计数。
答案 0 :(得分:2)
可以使用杜松子酒索引:
CREATE TABLE users (
name VARCHAR(100),
groups text[]
);
CREATE INDEX idx_users ON users USING GIN(groups);
-- disable sequential scan in this test:
SET enable_seqscan TO off;
EXPLAIN ANALYZE
SELECT name FROM users WHERE groups @> (ARRAY['Engineering']);
结果:
"Bitmap Heap Scan on users (cost=4.26..8.27 rows=1 width=218) (actual time=0.021..0.021 rows=0 loops=1)"
" Recheck Cond: (groups @> '{Engineering}'::text[])"
" -> Bitmap Index Scan on idx_users (cost=0.00..4.26 rows=1 width=0) (actual time=0.016..0.016 rows=0 loops=1)"
" Index Cond: (groups @> '{Engineering}'::text[])"
"Total runtime: 0.074 ms"
在数组上使用聚合函数,这将是另一个问题。函数unnest()可能会有所帮助。
为什么不规范化数据?这将解决所有问题,包括你还没有解决的许多问题。
答案 1 :(得分:0)
我认为处理此问题的最佳方法是规范化您的模型。以下内容可能包含错误,因为我没有尝试过,但这个想法应该是明确的:
CREATE TABLE users (id INTEGER PRIMARY KEY, name VARCHAR(100) UNIQUE);
CREATE TABLE groups (id INTEGER PRIMARY KEY, name VARCHAR(100) UNIQUE);
CREATE TABLE user_group (
user INTEGER NOT NULL REFERENCES users,
group INTEGER NOT NULL REFERENCES groups);
CREATE UNIQUE INDEX user_group_unique ON user_group (user, group);
SELECT users.name
FROM user_group
INNER JOIN users ON user_group.user = users.id
INNER JOIN groups ON user_group.group = groups.id
WHERE groups.name = 'Engineering';
由此产生的执行计划应该相当有效;您可以通过索引ON user_group(group)来进行优化,这允许index_scan而不是sequential_scan来查找特定组的成员。