从MySQL中的分层数据生成基于深度的树(无CTE)

时间:2011-03-13 17:23:57

标签: mysql hierarchical-data common-table-expression

您好多天我一直在研究MySQL中的这个问题,但是我无法弄明白。你们中有人有什么建议吗?

基本上,我有一个类别表,其中包含以下域名:idname(类别名称)和parent(类别的父级ID)。

示例数据:

1  Fruit        0
2  Apple        1
3  pear         1
4  FujiApple    2
5  AusApple     2
6  SydneyAPPLE  5
....

有许多级别,可能超过3个级别。我想创建一个sql查询,根据他的层次结构对数据进行分组:parent>孩子>孙子>等

它应该输出树结构,如下所示:

1 Fruit 0
 ^ 2 Apple 1
   ^ 4 FujiApple 2
   - 5 AusApple 2
     ^ 6 SydneyApple 5
 - 3 pear 1

我可以使用单个SQL查询执行此操作吗?我尝试过并且确实有效的替代方案如下:

SELECT * FROM category WHERE parent=0

在此之后,我再次遍历数据,并选择parent = id的行。这似乎是一个糟糕的解决方案。因为它是mySQL,所以不能使用CTE。

4 个答案:

答案 0 :(得分:37)

如果使用存储过程,可以在从php到mysql的单个调用中执行此操作:

示例调用

mysql> call category_hier(1);

+--------+---------------+---------------+----------------------+-------+
| cat_id | category_name | parent_cat_id | parent_category_name | depth |
+--------+---------------+---------------+----------------------+-------+
|      1 | Location      |          NULL | NULL                 |     0 |
|      3 | USA           |             1 | Location             |     1 |
|      4 | Illinois      |             3 | USA                  |     2 |
|      5 | Chicago       |             3 | USA                  |     2 |
+--------+---------------+---------------+----------------------+-------+
4 rows in set (0.00 sec)


$sql = sprintf("call category_hier(%d)", $id);

希望这会有所帮助:)

完整脚本

测试表结构:

drop table if exists categories;
create table categories
(
cat_id smallint unsigned not null auto_increment primary key,
name varchar(255) not null,
parent_cat_id smallint unsigned null,
key (parent_cat_id)
)
engine = innodb;

测试数据:

insert into categories (name, parent_cat_id) values
('Location',null),
   ('USA',1), 
      ('Illinois',2), 
      ('Chicago',2),  
('Color',null), 
   ('Black',3), 
   ('Red',3);

步骤:

drop procedure if exists category_hier;

delimiter #

create procedure category_hier
(
in p_cat_id smallint unsigned
)
begin

declare v_done tinyint unsigned default 0;
declare v_depth smallint unsigned default 0;

create temporary table hier(
 parent_cat_id smallint unsigned, 
 cat_id smallint unsigned, 
 depth smallint unsigned default 0
)engine = memory;

insert into hier select parent_cat_id, cat_id, v_depth from categories where cat_id = p_cat_id;

/* http://dev.mysql.com/doc/refman/5.0/en/temporary-table-problems.html */

create temporary table tmp engine=memory select * from hier;

while not v_done do

    if exists( select 1 from categories p inner join hier on p.parent_cat_id = hier.cat_id and hier.depth = v_depth) then

        insert into hier 
            select p.parent_cat_id, p.cat_id, v_depth + 1 from categories p 
            inner join tmp on p.parent_cat_id = tmp.cat_id and tmp.depth = v_depth;

        set v_depth = v_depth + 1;          

        truncate table tmp;
        insert into tmp select * from hier where depth = v_depth;

    else
        set v_done = 1;
    end if;

end while;

select 
 p.cat_id,
 p.name as category_name,
 b.cat_id as parent_cat_id,
 b.name as parent_category_name,
 hier.depth
from 
 hier
inner join categories p on hier.cat_id = p.cat_id
left outer join categories b on hier.parent_cat_id = b.cat_id
order by
 hier.depth, hier.cat_id;

drop temporary table if exists hier;
drop temporary table if exists tmp;

end #

测试运行:

delimiter ;

call category_hier(1);

call category_hier(2);

使用Yahoo geoplanet进行的一些性能测试会放置数据

drop table if exists geoplanet_places;
create table geoplanet_places
(
woe_id int unsigned not null,
iso_code  varchar(3) not null,
name varchar(255) not null,
lang varchar(8) not null,
place_type varchar(32) not null,
parent_woe_id int unsigned not null,
primary key (woe_id),
key (parent_woe_id)
)
engine=innodb;

mysql> select count(*) from geoplanet_places;
+----------+
| count(*) |
+----------+
|  5653967 |
+----------+

这样表中的560万行(地点)让我们看看从php调用的邻接列表实现/存储过程是如何处理的。

     1 records fetched with max depth 0 in 0.001921 secs
   250 records fetched with max depth 1 in 0.004883 secs
   515 records fetched with max depth 1 in 0.006552 secs
   822 records fetched with max depth 1 in 0.009568 secs
   918 records fetched with max depth 1 in 0.009689 secs
  1346 records fetched with max depth 1 in 0.040453 secs
  5901 records fetched with max depth 2 in 0.219246 secs
  6817 records fetched with max depth 1 in 0.152841 secs
  8621 records fetched with max depth 3 in 0.096665 secs
 18098 records fetched with max depth 3 in 0.580223 secs
238007 records fetched with max depth 4 in 2.003213 secs

总的来说,我对这些冷运行时非常满意,因为我甚至不会考虑将数万行数据返回到我的前端,而是宁愿构建树,每次调用仅动态获取几个级别。哦,只是因为你认为innodb比myisam慢 - 我测试的myisam实现的速度是所有计数的两倍。

此处有更多内容:http://pastie.org/1672733

希望这会有所帮助:)

答案 1 :(得分:8)

在RDBMS中存储分层数据有两种常用方法:邻接列表(您正在使用)和嵌套集。在Managing Hierarchical Data in MySQL中有关于这些替代方案的非常好的报道。您只能使用嵌套集模型在单个查询中执行所需操作。但是,嵌套集模型使更新层次结构更加有效,因此您需要根据操作要求考虑权衡。

答案 2 :(得分:3)

使用单个查询无法实现此目的。在这种情况下,您的分层数据模型无效。我建议你尝试另外两种在数据库中存储分层数据的方法:MPTT模型或“沿袭”模型。使用这些模型中的任何一个都可以让您一次性完成所需的选择。

以下是一篇详细介绍的文章:http://articles.sitepoint.com/article/hierarchical-data-database

答案 3 :(得分:0)

线性方式:

我正在使用一个丑陋的函数在一个简单的字符串字段中创建一个树。

/              topic title
/001           message 1
/002           message 2
/002/001       reply to message 2
/002/001/001/  reply to reply
/003           message 3
etc...

该表可用于通过简单的SQL查询选择树顺序中的所有行:

select * from morum_messages where m_topic=1234 order by m_linear asc

INSERT只是选择父线性(和子)并根据需要计算字符串。

select M_LINEAR FROM forum_messages WHERE m_topic = 1234 and M_LINEAR LIKE '{0}/___' ORDER BY M_LINEAR DESC limit 0,1  
/* {0} - m_linear of the parent message*/

DELETE很简单,就像删除邮件一样,或者通过线性删除父邮件的所有回复。