如何使用维基百科api获取完整的图像评论?

时间:2011-10-29 22:23:43

标签: wikipedia

我从维基百科api抓取一些图像元数据,但注意到文本可能会被截断。

在此页面上: http://en.wikipedia.org/w/api.php?action=query&prop=imageinfo&iiprop=comment&format=xml&titles=File:BrolinFoxFassbenderJonahHexJuly09.jpg

我只看到:

{{OTRS pending|year=2009|month=August|day=16}} {{Information |Description={{en|Josh Brolin, Megan Fox, and Michael Fassbender promoting the 2010 film ''Jonah Hex'' at San Diego Comic-Con.}} |Source= http://www.flickr.com/photos/sdnatasha/3767292285/ |Date=

如果我查看文件的真实数据: http://commons.wikimedia.org/wiki/Special:Export/File:BrolinFoxFassbenderJonahHexJuly09.jpg

我看到了完整的信息:

== {{int:filedesc}} =={{Information|Description={{en|Josh Brolin, Megan Fox, and Michael Fassbender promoting the 2010 film ''Jonah Hex'' at San Diego Comic-Con.}}|Source= http://www.flickr.com/photos/sdnatasha/3767292285/|Date=2009-07-28|Author=NatashaBaucas at http://www.flickr.com/photos/sdnatasha/|Permission=Creative Commons Attribution|other_versions=}}{{Location dec|32.705573|-117.160391|}}== {{int:license}} =={{self|cc-by-2.0|author=Natasha Baucas}}{{PermissionOTRS|ticket= https://ticket.wikimedia.org/otrs/index.pl?Action=AgentTicketZoom&TicketID=3519937}}[[Category:MeganFox in 2009]][[Category:Josh Brolin]][[Category:Michael Fassbender]][[Category:2009 Comic-Con International]][[Category:Images uploaded by User:Nehrams2020]

我可以使用wikipedia api获取非截断的评论吗?

1 个答案:

答案 0 :(得分:3)

您使用iiprop=comment获得的注释是“文件历史记录”表中显示的短文本,以及它们被截断为255字节的原因是因为它们是如何存储在数据库中的从...开始。

您想要的是文件描述页面的内容,您可以使用与获取任何页面内容相同的方式:rvprop=content

(之所以令人困惑的原因是因为默认的MediaWiki上传界面有点奇怪。图片评论真的意味着是类似于编辑摘要的简短笔记,但是当你第一次上传时一个新的图像,您输入的同一文本用于两个用于页面内容和图像注释。如果它太长而不适合评论 - 这在维基百科上很常见 - 评论是默默地被截断,但是全文仍然会进入页面内容。我想有人认为这个界面在第一次写入时有意义;当时图像描述往往要短得多。)