检测是否是用Magento编写的电子商店

时间:2015-08-04 11:34:33

标签: python html magento url

我正在尝试创建一个可以做一件简单事情的脚本。输入是一个URL列表,输出是用 Magento 编写的那些eshops列表。

我读过没有办法知道是否是 Magento 中的电子商店或其他什么,但我也读到有很多迹象可以告诉你这个网络页面使用 Magento 几乎100%肯定。

所以我找到了这个页面:magento detector它可以告诉你它是否是Magento所以我试图使用他们的信息。

他们说例如:

  
    

Magento 将其用户界面文件放在名为/skin/的目录中。对于前端(不是admin ui),文件位于/skin/frontend。因此,如果页面源中存在此目录,那么商店很可能在 Magento 上运行。

  

例如对于这个eshop:starkk告诉检测器它是一个magento,它遇到的条件之一是我上面提到的条件。

我如何检查目录是否存在?我看了一下:http://www.starkk.de/skin/frontend/使用浏览器,但页面引发了错误。

还有一个问题:你是否知道另一种更好的方法来检测 Magento

1 个答案:

答案 0 :(得分:2)

总结一下:

要确定某个网站是否使用Magento,您通常会首先查找可以最好地告诉您是否使用Magento的标志。这些标志的SOY将具有高信心,其他一些低信心。可能有时你会发现结果相互矛盾的迹象。你需要考虑如何处理这些案件。

对于初学者,Firefox有一个名为Wappalyzer的扩展名(网站编写时速度极慢),它决定了访问网站时使用的Web应用程序。

他们对Magento的规则很简短:

  1. HTTP响应标头:使用名为“frontend”的密钥设置Cookie ...
  2. 文件夹/ js / mage中的脚本
  3. 使用文件夹/皮肤/前端
  4. DOM,在gloabl window对象上,Magento创建了一个Mage对象和一个VarienForm对象。在您提供的链接上,我可以找到Varien对象(不是VarienForm
  5. 来源 https://github.com/AliasIO/Wappalyzer/blob/master/src/apps.json#L3423

    我对Python并不擅长,但我想第1,2和3点很容易检查(检查主页源中存在的用法)。如果您收到403 Forbidden文件夹,请尝试一个显然不存在的文件夹:如果它返回404 Not Found,那么403 Forbidden肯定是现有目录。或者确定一个应该始终在此文件夹中的文件并检查其存在。

    永远不要认为结果是100%确定......