使用category和categorylinks表查找维基百科类别的子类别

时间:2014-02-14 14:48:48

标签: mediawiki

我从mediawiki下载了category和categorylinks表sql.gz文件,并生成了所需的表格:

类别和类别链接

表格手册: CategoryLinks Category

考虑以下类别页面:NoSQL 此页面的父类别是数据库和数据库管理。我如何从这两个表中获取此信息? 类别表的手册说明如下,但我无法获得该信息: "

  

注意:页面和子类别存储在类别链接中   。表"

1 个答案:

答案 0 :(得分:7)

单独的类别没有层次结构。这是使子类别化工作的类别页面。因此,您还必须从page_id表中获取page才能解决此关系。

它基本上是这样的:

  1. 类别cat_title是页面标题。
  2. 在页面表中找到page_title,获取page_id
  3. 使用page_id获取cl_from
  4. 中的类别链接
  5. cl_to
  6. 获取父类别标题
  7. 从2
  8. 重复