如何知道维基百科XML转储中的文章是否为列表?

时间:2016-01-08 15:21:54

标签: xml wikipedia mediawiki-api mediawiki-templates wikimedia-dumps

有指示判断文章是否为消歧页面。 我想知道是否有任何指令/维基媒体模板用于将文章标记为列表?

到目前为止,我发现检查这个的唯一方法是通过维基数据P360 Property,但理想情况下我想从维基百科XML转储中获取此信息。

1 个答案:

答案 0 :(得分:2)

文章中没有此类信息,但如果标题以" List of..." 开头,则可以查看标题。

我不确定所有具有Property:P360的项目是列表文章(例如某些消除歧义项目,例如Q3086),但您可以access themMediaWiki API

https://www.wikidata.org/w/api.php?action=query&list=backlinks&bltitle=Property:P360&blnamespace=0&bllimit=500

所有列表文章都通过instance of维基媒体列表文章(Q13406463)在维基数据中标记。您可以使用WikidataQuery API

获取所有这些内容
http://wdq.wmflabs.org/api?q=claim[31:13406463]

目前他们是216,685(104,843 in enwiki

您还可以使用P360过滤所有不是消除歧义项目的项目:

http://wdq.wmflabs.org/api?q=claim[360] AND noclaim[31:4167410]