有没有办法知道网址的所有扩展名?
例如,假设有一个名为www.blabla.com
还有另一页www.blabla.com/blabla2.html
。
有没有办法只从www.blabla.com/blabla2.html
了解www.blabla.com
?
答案 0 :(得分:3)
不,不可能。因为主域名背后的名字 大多是完全虚拟的。 意味着该名称背后的资源不能是具体文件 或具体的网页
在您访问每个网址至少一次之前,您无法知道。 比其他答案提到的WebCrawler更有意义。
我的回答还暗示现在有恶意软件可以查看最新消息。
看看Unix wget。这提供了一些很好的可能性
答案 1 :(得分:2)
我认为您正在寻找的是网络抓取工具:https://en.wikipedia.org/wiki/Web_crawler
在较高级别,您请求基页,然后请求在该页面上链接的所有页面。继续此过程应该产生网站上引用的所有URL。但是,如果www.blabla.com/blabla2.html是真实页面但从未真正链接到网站,则此过程无法找到它。