我从维基百科api抓取一些图像元数据,但注意到文本可能会被截断。
我只看到:
{{OTRS pending|year=2009|month=August|day=16}} {{Information
|Description={{en|Josh Brolin, Megan Fox, and Michael Fassbender promoting
the 2010 film ''Jonah Hex'' at San Diego Comic-Con.}} |Source=
http://www.flickr.com/photos/sdnatasha/3767292285/ |Date=
如果我查看文件的真实数据: http://commons.wikimedia.org/wiki/Special:Export/File:BrolinFoxFassbenderJonahHexJuly09.jpg
我看到了完整的信息:
== {{int:filedesc}} =={{Information|Description={{en|Josh Brolin, Megan Fox,
and Michael Fassbender promoting the 2010 film ''Jonah Hex'' at San Diego
Comic-Con.}}|Source=
http://www.flickr.com/photos/sdnatasha/3767292285/|Date=2009-07-28|Author=NatashaBaucas
at
http://www.flickr.com/photos/sdnatasha/|Permission=Creative Commons
Attribution|other_versions=}}{{Location dec|32.705573|-117.160391|}}==
{{int:license}} =={{self|cc-by-2.0|author=Natasha
Baucas}}{{PermissionOTRS|ticket=
https://ticket.wikimedia.org/otrs/index.pl?Action=AgentTicketZoom&TicketID=3519937}}[[Category:MeganFox
in 2009]][[Category:Josh Brolin]][[Category:Michael
Fassbender]][[Category:2009 Comic-Con International]][[Category:Images
uploaded by User:Nehrams2020]
我可以使用wikipedia api获取非截断的评论吗?
答案 0 :(得分:3)
您使用iiprop=comment
获得的注释是“文件历史记录”表中显示的短文本,以及它们被截断为255字节的原因是因为它们是如何存储在数据库中的从...开始。
您想要的是文件描述页面的内容,您可以使用与获取任何页面内容相同的方式:rvprop=content
。
(之所以令人困惑的原因是因为默认的MediaWiki上传界面有点奇怪。图片评论真的意味着是类似于编辑摘要的简短笔记,但是当你第一次上传时一个新的图像,您输入的同一文本用于两个用于页面内容和图像注释。如果它太长而不适合评论 - 这在维基百科上很常见 - 评论是默默地被截断,但是全文仍然会进入页面内容。我想有人认为这个界面在第一次写入时有意义;当时图像描述往往要短得多。)