是否可以批量获取维基百科图像元数据?

时间:2011-07-28 23:05:07

标签: parsing wikipedia

例如,此图片网址(http://en.wikipedia.org/wiki/File:NewYork1777MapRestoredSmall.png)包含有关其描述的信息:“英文:纽约和新泽西省的地图”

我看了http://en.wikipedia.org/w/api.php。它允许一次允许多个查询,但它只有以下字段: timestamp, user, userid, comment, parsedcomment, url, size, dimensions, sha1, mime, thumbmime, metadata, archivename, bitdepth

没有说明字段。是解析这个html页面的唯一方法吗?

1 个答案:

答案 0 :(得分:1)

看起来评论或解析评论可能会给你你想要的东西。注释似乎返回Summary部分的wiki标记,而parsedcomment似乎返回HTML。