是否有用于获取网页URL的正确变体的脚本或其他方法?

时间:2010-08-27 06:49:21

标签: url delicious-api

我假设每个网页都有一个正确的网址变体。如果我错了,请纠正我。

如果输入了等效的URL,我需要更正URL。例如,大多数浏览器接受来自确切网址的细微变化,但是然后更正它以将您带到正确的页面? (或者这可能是在DNS级别完成的?)

我正在处理的任务是获取URL的正确MD5哈希值,该哈希值将被API服务识别,该API服务返回有关URL的信息。例如,如果我散列'http://stackoverflow.com',我会得到一个空响应。为了获得有效的响应,我需要散列'https://stackoverflow.com/',(带有斜杠)。

编辑:我使用的API服务是Delicious API。如果与任何人的经历产生共鸣。

1 个答案:

答案 0 :(得分:1)

  

我假设每个网页都有一个正确的网址变体。如果我错了,请纠正我。

如果作者决定应该存在,那么只有一个“正确的”,那么他们可能会使用canonical和HTTP重定向的组合来推动人们朝这个方向发展。

  

例如,大多数浏览器都会接受来自确切网址的细微变化,但会更正它以将您带到正确的页面?

主机名不区分大小写,并且根不需要斜杠(因此http://example.comhttp://EXAMPLE.cOM/相同)。

Beyone,URL的其余部分(片段标识符除外)是由HTTP服务器完全处理的。它可能会区分大小写,但可能不会。它可能需要按某种顺序排列,但可能不需要。