获取维基百科文章的当前状态?

时间:2011-07-06 17:42:35

标签: python mysql wikipedia milestone

我正在使用Python和MySQL来查询mediawiki数据库以获取文章的当前状态(即文章是FA,GA,GAN等)但是却无法这样做。

我知道当前状态存储在文本表的old_text字段中。我试图做类似的事情:

loc = select (locate('currentstatus', old_text))
query = ('select substring(old_text, '%s', 20) from wikidb where page_id = 1234' % (loc))

但不幸的是,loc给出了currentstatus的第一次出现,而不是最新出现的,因为最新/最新状态位于底部。

我不确定如何修复它,或者我是否使用正确的方法。

1 个答案:

答案 0 :(得分:0)

对于维基百科,更重要的是要检查文章所在的类别。或者如果处理原始wiki文本,请查找相应的模板:

  • 精选文章(FA)位于[[类别:精选文章]]并使用{{精选文章}},其中引用[[模板:精选文章]]
  • 好文章(GA)在[[category:Good articles]]中,并使用{{good article}},引用[[template:good article]]

这两个类别都是隐藏的,因此您必须启用显示隐藏类别的首选项,或遍历类别内容以查看文章是否存在。

使用一个或多个WikiProject模板在相应的谈话页面上评估其他文章类(A,B,C,FL,开始,存根,列表,未定义)。没有标准。