如何使用wget来计算网站上的页数?

时间:2013-05-11 05:48:17

标签: php bash wget

有潜在的客户网站要求我们重新设计。通常当我问,“你的网站有多少页?”我经常得到的答案是,“我不知道”。如果他们的网站上有10个页面可以很容易计算,但这些页面可能是数百页的大型网站。

有没有办法统计网站上的所有网页而不用手动操作?我知道wget可以用来从网站上下载页面,但是我不想下载他们所有的页面,除此之外我只会给你一些文件而不是页面。

这是解决方案吗?如果是这样,它如何用于计算网站的页面?如果没有wget,还有其他解决方案吗?请记住,我没有内部访问他们的网站进行计数,它必须从网上完成。或者将内部链接计为等于页面?

1 个答案:

答案 0 :(得分:1)

如果网站是静态的或小的,您可以轻松统计网页。

但如果网站太大,如StackOverflow,那么您可以使用Google indexing

只需转到Google并搜索:site:stackoverflow.com

它返回页数:About 17,000,000 results

您可以在每个网站前放置site:,谷歌会显示该网站的总页数