家谱树算法

时间:2012-01-22 14:31:38

标签: mysql algorithm tree genealogy

我是这个领域的新手,喜欢写一个管理家谱数据的应用程序。我主要担心的是如何从MySQL存储和检索这些数据。我知道像Oracle这样的数据库针对递归查询进行了优化,但也许我可以找到使用MySQL的替代解决方案,我认为它不支持“CONNECT”。 PS。我知道有数千个现有的开源解决方案,但考虑到这些数据将是功能的有限部分,我需要保持对完整代码的控制。

我在网上快速浏览并发现了一些有趣的方法,例如基于Interval的算法,它非常适合查询但不满意更新/删除。

我将看看基于前缀(Dewey)的方法,但是人们可能知道一种有效且经过验证的方法来分享?

感谢

吉勒

2 个答案:

答案 0 :(得分:3)

第一个问题,设计数据架构:我将层次结构保留为父行的外键。这很简单。

第二个问题,检索后代/后代:正如您所解释的那样,问题来自于:选择一些人和所有后代的后代。要解决此问题,您应该创建一个新的树表。此表包含对:与具有所有祖先(及其自身)的人的组合:

people( id, name, id_parent)
people_tree( id, id_ancestor, distance )

注意到使用此结构很容易查询层次结构。示例:某人的所有后代:

select people.*, distance
from 
  people p
    inner join 
  people_tree t 
    on ( p.id = t.id)
where
  id_ancesor = **sombody.id **

你可以通过距离来获得只有祖父母,孙子女等......

最后一个问题,保持树:树必须始终是数据。您应该自动执行此操作:触发people或CRUD操作的存储过程

<强> EDITED

因为这是一个家谱树,每个人必须同时拥有父母和母亲的参考:

people( id, name, id_parent, id_mother)

然后,需要2棵树:

parent_ancestors_tree( id, id_ancestor, distance )
mother_ancestors_tree( id, id_ancestor, distance )

大卫要求提供样本数据:

people: id    name    id_parent    id_mother
         1    Adam         NULL      NULL
         2    Eva          NULL      NULL
         3    Cain            1         2
        ..    ...
         8    Enoc            3         5

parent_ancestors_tree id    id_ancestor  distance
              (Adam)   1              1         0
              (Eva)    2              2         0
              (Cain)   3              3         0
                       3              1         1
              (Enoc)   8              8         0
                       8              3         1
                       8              1         2

mother_ancestors_tree id    id_ancestor  distance
              (Adam)   1              1         0
              (Eva)    2              2         0
              (Cain)   3              3         0
                       3              2         1
              (Enoc)   8              8         0
                  -- here ancestors of Enoc's mother --

问候。

答案 1 :(得分:1)

我还建议使用相邻的树模型,对于更复杂的逻辑,我建议使用简单的mysql查询(连接)。最有可能创建树更重要。当应用程序完成并且一切正常时,您可以进行更多的数据挖掘。