mysql:为每个用户制作单独的表是个好主意?哪种结构更适合寻找用户?

时间:2017-04-30 11:04:18

标签: mysql performance data-structures database-performance

我正在开发一个简单的社交网络,在同一个MySQL数据库中有用户及其对朋友的请求

我需要组织快速搜索用户。我需要找到尚未向朋友发送请求的用户。

目前我有这种结构:

mysql> SELECT * FROM profiles;
+----+---------+-----+---------+------------+
| id | name    | age | city_id | country_id |
+----+---------+-----+---------+------------+
|  1 | WILLIAM |  20 |       1 |          1 |
|  2 | JOHN    |  24 |       1 |          1 |
|  3 | ROBERT  |  21 |       3 |          2 |
|  4 | MICHAEL |  33 |       4 |          2 |
|  5 | JAMES   |  27 |      16 |          1 |
|  6 | DAVID   |  21 |      13 |        666 |
|  7 | RICHARD |  18 |       4 |          2 |
|  8 | CHARLES |  32 |      88 |          5 |
|  9 | JOSEPH  |  29 |       5 |          1 |
| 10 | THOMAS  |  19 |       1 |          1 |
+----+---------+-----+---------+------------+

mysql> SELECT * FROM request_for_friendship;
+----+---------+-------+
| id | from_id | to_id |
+----+---------+-------+
|  1 |       1 |     2 |
|  2 |       1 |     3 |
|  3 |       1 |     8 |
|  5 |       4 |     1 |
|  6 |       9 |     1 |
+----+---------+-------+

id = 1发送请求的用户“向我显示用户”时,服务器必须返回1个用户,该用户未在request_for_friendship中请求,结果应按city_id进行过滤,{ {1}}和county_id

我的第一个SQL ageselect 1 random row with complex filtering):

NOT EXIST

没有LIMIT的结果:

SELECT *
FROM
    (
        SELECT *, ABS(profiles.age - 21) AS nearest_age
        FROM profiles
        WHERE profiles.id != 1
        ORDER BY profiles.city_id <> 1, profiles.country_id <> 1, nearest_age
    ) AS users
WHERE
    NOT EXISTS (
        SELECT *
        FROM request_for_friendship
        WHERE
            (
                request_for_friendship.from_id = 1
                AND
                request_for_friendship.to_id = users.id
            )
            OR
            (
                request_for_friendship.from_id = users.id
                AND
                request_for_friendship.to_id = 1
            )
    )
LIMIT 0 , 1;

一切都很好,直到10,000名用户注册并发送了500,000个友谊请求。 之后,通过+----+---------+-----+---------+------------+-------------+ | id | name | age | city_id | country_id | nearest_age | +----+---------+-----+---------+------------+-------------+ | 10 | THOMAS | 19 | 1 | 1 | 2 | | 5 | JAMES | 27 | 16 | 1 | 6 | | 6 | DAVID | 21 | 13 | 666 | 0 | | 7 | RICHARD | 18 | 4 | 2 | 3 | +----+---------+-----+---------+------------+-------------+ 过滤的每位用户都花了NOT EXISTS 因此,如果用户发送了100个请求,则~0.05 sec用于过滤1个用户。

很明显,您不能使用0.05 * 100 = 5 sec进行过滤,因为每次都会为每个用户运行。

我的第二个SQL NOT EXISTSmysql: how to save ORDER BY after LEFT JOIN without reorder?):

LEFT JOIN

没有LIMIT的结果:

SELECT * FROM
(
    SELECT *, ABS(profiles.age - 21) AS nearest_age
    FROM profiles
    WHERE profiles.id != 1
    ORDER BY profiles.city_id <> 1, profiles.country_id <> 1, nearest_age
) as users
    LEFT JOIN request_for_friendship
    AS request_for_friendship_copy
    ON
    (
        request_for_friendship_copy.from_id = 1
        AND
        request_for_friendship_copy.to_id = users.id
    )
    OR
    (
        request_for_friendship_copy.from_id = users.id
        AND
        request_for_friendship_copy.to_id = 1
    );
LIMIT 1;

这个SQL非常快(+----+---------+-----+---------+------------+-------------+------+---------+-------+ | id | name | age | city_id | country_id | nearest_age | id | from_id | to_id | +----+---------+-----+---------+------------+-------------+------+---------+-------+ | 2 | JOHN | 24 | 1 | 1 | 3 | 1 | 1 | 2 | | 3 | ROBERT | 21 | 3 | 2 | 0 | 2 | 1 | 3 | | 8 | CHARLES | 32 | 88 | 5 | 11 | 3 | 1 | 8 | | 4 | MICHAEL | 33 | 4 | 2 | 12 | 5 | 4 | 1 | | 9 | JOSEPH | 29 | 5 | 1 | 8 | 6 | 9 | 1 | | 5 | JAMES | 27 | 16 | 1 | 6 | NULL | NULL | NULL | | 6 | DAVID | 21 | 13 | 666 | 0 | NULL | NULL | NULL | | 7 | RICHARD | 18 | 4 | 2 | 3 | NULL | NULL | NULL | | 10 | THOMAS | 19 | 1 | 1 | 2 | NULL | NULL | NULL | +----+---------+-----+---------+------------+-------------+------+---------+-------+ ),但正如您所看到的那样~0.02s已被破坏。当我将ORDER BY移到底部时(在JOIN之后),它花了ORDER BY。 它更好,但当用户数量将达到约1 000 000时,将花费大量时间。我找不到用~3.2s保持排序的方法。

现在我正考虑为每个用户创建一个个性化的表格,只会存储他们对朋友的请求

因此,我们可以像使用NOT EXISTS在SQL的第一个版本中那样排除用户 但现在所有用户都会根据他们对朋友的个人请求进行过滤

例如,在第一个变体中,对于过滤1,用户LEFT JOIN在500,000个其他请求中搜索了他对朋友的请求。 现在,对于1个用户的过滤,NOT EXISTS将仅向该用户亲自检查100-1000个请求。 但是这种方法需要在数据库中创建数百万个表。

这个想法有多好?您可以提供哪些其他优秀的解决方案?

P.S。对不起我的英文

1 个答案:

答案 0 :(得分:0)

你真的认为制作成千上万的桌子是个好主意吗?

NOT EXISTS很好,你可能只缺少索引。您需要两个索引(from_id,to_id)和on(to_id,from_id)。你需要他们两个。您也可以尝试将NOT EXISTS (A OR B)重写为NOT EXISTS A AND NOT EXISTS B,但它可能会相同。