维基百科图片网址中的额外字母是什么以及如何确定它们?

时间:2017-09-09 13:07:36

标签: javascript wikipedia

我注意到所有的维基百科网址都有一些额外的部分(通常是1个字符和2个字符,用下面的例子中的'/'分隔),似乎并不依赖于任何东西。

具体来说,我正在使用javascript并尝试从在线口袋妖怪维基百科等效中随机获取口袋妖怪精灵。我有下面的例子,在第一个URL中,我可以“计算”这个(Pichu是一个口袋妖怪,索引= 172)。但是,在javascript中,当我将图像源设置为此时,无法设置图像(因为尽管有后缀,但这是一个网页,而不是图像)。然而,第二个网址是一个实际的图像,但它有额外的“b / b9”,我似乎无法弄清楚它来自何处或如何确定它。

所以我的问题是:这些是什么意思?以及如何确定它们?

https://bulbapedia.bulbagarden.net/wiki/File:172Pichu.png https://cdn.bulbagarden.net/upload/b/b9/172Pichu.png

我问过维基百科的问题,因为每个图片的网址都遵循相同的模式。这是一个维基百科的例子:

https://commons.wikimedia.org/wiki/File:Westminstpalace.jpghttps://upload.wikimedia.org/wikipedia/commons/3/39/Westminstpalace.jpg额外字符'3/39'

1 个答案:

答案 0 :(得分:0)

这两个数字是hash code的一部分,用于帮助在服务器上存储图像文件。

如果您还没有图像,则无法直接计算这些数字。您必须解析预览页面的HTML以找到图像的正确URL。

对于https://commons.wikimedia.org/wiki/File:Westminstpalace.jpg,HTML代码将包含文本

<img alt="File:Westminstpalace.jpg" src="https://upload.wikimedia.org/wikipedia/commons/3/39/Westminstpalace.jpg" width="400" height="300" ... />

您需要找到此文本并提取src属性。