基于HTML源检测CMS(Wordpress等)

时间:2015-12-31 23:54:26

标签: html wordpress web content-management-system

是否有一些方法可以识别用于根据HTML源代码创建网页的CMS(内容管理系统)?

有时我会看到网页,并立即想知道他们开发了哪种工具。使用工具我的意思是CMS,如Wordpress,Drupal,Typo3等。我可以想到一些可以做到这一点的指纹识别技术。

1 个答案:

答案 0 :(得分:1)

很难准确地确定后端CMS。几乎所有的CMS系统都支持自定义主题,这些主题具有完全不同的HTML代码。

您最好的猜测是尝试通过以下方式识别CMS:

  1. 根目录中的robots.txt文件。

  2. CMS管理面板登录页面的存在。

  3. 用于提供图片资源(如图片)的文件夹结构 和css文件。

  4. 存在特定的CMS后端文件。

  5. 默认服务的URL结构,例如RSS。

  6. 例如,如果您猜测某个网站是否使用WordPress,您可以执行以下操作:

    1-检查robots.txt是否存在,如果它包含“Disallow:/ wp-admin /”,那么很有可能这是一个WordPress网站。

    2-如果您在http://domain_name/wp-admin访问默认的WordPress管理面板时收到回复,那么这很可能是一个WordPress网站。

    3-如果此文件存在http://domain_name/wp-mail.php,则很可能是WordPress网站。

    4-如果我们在此网址http://domain_name/?feed=rss2获得有效的RSS Feed,则很可能是这是一个WordPress网站。

    现在,如果一个网站满足上面列出的4个检测规则中的3个,你可以放心地说它是一个WordPress网站。

    在为每个要检测的CMS识别唯一检测规则时,您需要做同样的事情。

    请注意,现有服务(例如http://whatcms.org/http://guess.scritch.org/)可以执行我在此答案中所述的内容。

    祝你好运!