list = alllinks混乱

时间:2010-06-09 10:20:02

标签: api wikipedia wikipedia-api wikimedia

我正在为夏天做一个研究项目,我必须使用从维基百科获取一些数据,存储它然后对它进行一些分析。我正在使用维基百科API来收集数据,而且我已经很好地解决了这个问题。

我对API doc here中的links-alllinks选项有何疑问 在阅读完描述之后,在API本身(它的位置和位置,我不能直接链接到该部分),我想我明白它应该返回什么。然而,当我运行查询时,它给了我一些我没想到的东西。

这是我跑的查询:

http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=google&rvprop=ids|timestamp|user|comment|content&rvlimit=1&list=alllinks&alunique&allimit=40&format=xml

实质上说:获取Google页面的最新修订版,包括每个修订版的ID,时间戳,用户,评论和内容,并以XML格式返回。 allinks(我认为)应该给我一个指向谷歌页面的维基百科页面列表(在这种情况下是前40个独特的页面)。

我不确定誓言的政策是什么,但这是我完全回来的结果:

<?xml version="1.0"?>
<api>
    <query><normalized>
        <n from="google" to="Google" />
        </normalized>
        <pages>
            <page pageid="1092923" ns="0" title="Google">
                <revisions>
                    <rev revid="366826294" parentid="366673948" user="Citation bot" timestamp="2010-06-08T17:18:31Z" comment="Citations: [161]Tweaked: url. [[User:Mono|Mono]]" xml:space="preserve">
                        <!-- The page content, I've replaced this cos its not of interest -->
                    </rev>
                </revisions>
            </page>
        </pages>
        <alllinks>
                <!-- offensive content removed -->
        </alllinks>
    </query>
    <query-continue>
        <revisions rvstartid="366673948" />
        <alllinks alfrom="!2009" />
    </query-continue>
</api>

<alllinks>部分,它只是一堆随机的狼吞虎咽和冒犯性的评论。几乎没有我认为我会得到的。我做了很多搜索,但似乎无法直接回答我的问题。

  1. list=alllinks选项应该返回什么?
  2. 为什么我要把这个废话放在那里?

1 个答案:

答案 0 :(得分:2)