Question

可以在类型为字符串数组的列上创建索引。尝试使用 GIN索引。但查询似乎没有使用这些索引。

Example

CREATE TABLE users (
 name VARCHAR(100),
 groups text[],
);

Query: SELECT name FROM users WHERE ANY(groups) = 'Engineering'.

同样有效地在'groups'列上执行GROUP BY的最佳方法是什么，以便它可以给'组'和计数。

Answer 1

可以使用杜松子酒索引：

CREATE TABLE users (
 name VARCHAR(100),
 groups text[]
);

CREATE INDEX idx_users ON users USING GIN(groups);

-- disable sequential scan in this test:
SET enable_seqscan TO off;

EXPLAIN ANALYZE
SELECT name FROM users WHERE  groups @> (ARRAY['Engineering']);

结果：

"Bitmap Heap Scan on users  (cost=4.26..8.27 rows=1 width=218) (actual time=0.021..0.021 rows=0 loops=1)"
"  Recheck Cond: (groups @> '{Engineering}'::text[])"
"  ->  Bitmap Index Scan on idx_users  (cost=0.00..4.26 rows=1 width=0) (actual time=0.016..0.016 rows=0 loops=1)"
"        Index Cond: (groups @> '{Engineering}'::text[])"
"Total runtime: 0.074 ms"

在数组上使用聚合函数，这将是另一个问题。函数unnest（）可能会有所帮助。

为什么不规范化数据？这将解决所有问题，包括你还没有解决的许多问题。

Answer 2

我认为处理此问题的最佳方法是规范化您的模型。以下内容可能包含错误，因为我没有尝试过，但这个想法应该是明确的：

CREATE TABLE users (id INTEGER PRIMARY KEY, name VARCHAR(100) UNIQUE);
CREATE TABLE groups (id INTEGER PRIMARY KEY, name VARCHAR(100) UNIQUE);
CREATE TABLE user_group (
    user INTEGER NOT NULL REFERENCES users,
    group INTEGER NOT NULL REFERENCES groups);
CREATE UNIQUE INDEX user_group_unique ON user_group (user, group);

SELECT users.name
    FROM user_group
    INNER JOIN users ON user_group.user = users.id
    INNER JOIN groups ON user_group.group = groups.id
    WHERE groups.name = 'Engineering';

由此产生的执行计划应该相当有效;您可以通过索引ON user_group（group）来进行优化，这允许index_scan而不是sequential_scan来查找特定组的成员。

PostgreSql中索引字符串列类型的索引

2 个答案: