如何根据基本URL地址获取url地址的所有扩展名?

时间:2013-12-14 06:09:43

标签: networking network-protocols network-security

有没有办法知道网址的所有扩展名?

例如,假设有一个名为www.blabla.com

的网站

还有另一页www.blabla.com/blabla2.html

有没有办法只从www.blabla.com/blabla2.html了解www.blabla.com

2 个答案:

答案 0 :(得分:3)

不,不可能。因为主域名背后的名字 大多是完全虚拟的。 意味着该名称背后的资源不能是具体文件 或具体的网页

在您访问每个网址至少一次之前,您无法知道。 比其他答案提到的WebCrawler更有意义。

我的回答还暗示现在有恶意软件可以查看最新消息。

看看Unix wget。这提供了一些很好的可能性

答案 1 :(得分:2)

我认为您正在寻找的是网络抓取工具:https://en.wikipedia.org/wiki/Web_crawler

在较高级别,您请求基页,然后请求在该页面上链接的所有页面。继续此过程应该产生网站上引用的所有URL。但是,如果www.blabla.com/blabla2.html是真实页面但从未真正链接到网站,则此过程无法找到它。