是否有一些方法可以识别用于根据HTML源代码创建网页的CMS(内容管理系统)?
有时我会看到网页,并立即想知道他们开发了哪种工具。使用工具我的意思是CMS,如Wordpress,Drupal,Typo3等。我可以想到一些可以做到这一点的指纹识别技术。
答案 0 :(得分:1)
很难准确地确定后端CMS。几乎所有的CMS系统都支持自定义主题,这些主题具有完全不同的HTML代码。
您最好的猜测是尝试通过以下方式识别CMS:
根目录中的robots.txt文件。
CMS管理面板登录页面的存在。
用于提供图片资源(如图片)的文件夹结构 和css文件。
存在特定的CMS后端文件。
默认服务的URL结构,例如RSS。
例如,如果您猜测某个网站是否使用WordPress,您可以执行以下操作:
1-检查robots.txt是否存在,如果它包含“Disallow:/ wp-admin /”,那么很有可能这是一个WordPress网站。
2-如果您在http://domain_name/wp-admin访问默认的WordPress管理面板时收到回复,那么这很可能是一个WordPress网站。
3-如果此文件存在http://domain_name/wp-mail.php,则很可能是WordPress网站。
4-如果我们在此网址http://domain_name/?feed=rss2获得有效的RSS Feed,则很可能是这是一个WordPress网站。
现在,如果一个网站满足上面列出的4个检测规则中的3个,你可以放心地说它是一个WordPress网站。
在为每个要检测的CMS识别唯一检测规则时,您需要做同样的事情。
请注意,现有服务(例如http://whatcms.org/和http://guess.scritch.org/)可以执行我在此答案中所述的内容。
祝你好运!