获取仅属于类别中的字母的页面

时间:2014-07-16 09:56:59

标签: wikipedia wikipedia-api mediawiki-api wikimedia

当某人打开维基百科类别时,他可以观察按字母顺序组织并位于字母(A,B,C等)下的页面。

例如

http://en.wikipedia.org/wiki/Category:Countries_in_Europe

但也有一些相关的页面,位于星号(*),点(。)或顶部。如何仅提取字母下的那些页面?

或者有人可以解释这些类别之间的文章代码或类别关系的区别([*,。]和[A,B,C]之间)......

1 个答案:

答案 0 :(得分:3)

在南苏丹说,为MediaWiki页面分配类别时,您可以使用语法[[Category:Countries|Sudan]],使其在苏丹而不是默认(南苏丹)下排序。在维基百科上,这通常用于将类别的“主页”放在类别页面的顶部,方法是添加类似*-或类似的排序键(通常使用的字符)作为主页的定义,将根据您正在查看的维基百科版本而有所不同。

在向API询问某个类别的成员时,请使用cmsort=sortkeyprefix相应地对结果进行排序。此外,您可以使用cmendsortkey停止某个排序键,例如1A。或者您可以打印排序键,并使用cmprop=sortkeyprefixhttp://en.wikipedia.org/w/api.php?action=query&list=categorymembers&cmtitle=Category:Physics&cmsort=sortkey&cmprop=sortkeyprefix|title

过滤您旁边的列表

the official MediaWiki documentation中记录了这一点。

在上面的例子中,前五页有一个特殊的排序键(空格),表示它们是该类别的某种主页。