我正在尝试创建一个可以做一件简单事情的脚本。输入是一个URL列表,输出是用 Magento 编写的那些eshops列表。
我读过没有办法知道是否是 Magento 中的电子商店或其他什么,但我也读到有很多迹象可以告诉你这个网络页面使用 Magento 几乎100%肯定。
所以我找到了这个页面:magento detector它可以告诉你它是否是Magento所以我试图使用他们的信息。
他们说例如:
Magento 将其用户界面文件放在名为
/skin/
的目录中。对于前端(不是admin ui),文件位于/skin/frontend
。因此,如果页面源中存在此目录,那么商店很可能在 Magento 上运行。
例如对于这个eshop:starkk告诉检测器它是一个magento,它遇到的条件之一是我上面提到的条件。
我如何检查目录是否存在?我看了一下:http://www.starkk.de/skin/frontend/
使用浏览器,但页面引发了错误。
还有一个问题:你是否知道另一种更好的方法来检测 Magento ?
答案 0 :(得分:2)
总结一下:
要确定某个网站是否使用Magento,您通常会首先查找可以最好地告诉您是否使用Magento的标志。这些标志的SOY将具有高信心,其他一些低信心。可能有时你会发现结果相互矛盾的迹象。你需要考虑如何处理这些案件。
对于初学者,Firefox有一个名为Wappalyzer的扩展名(网站编写时速度极慢),它决定了访问网站时使用的Web应用程序。
他们对Magento的规则很简短:
DOM
,在gloabl window
对象上,Magento创建了一个Mage
对象和一个VarienForm
对象。在您提供的链接上,我可以找到Varien
对象(不是VarienForm
)来源 https://github.com/AliasIO/Wappalyzer/blob/master/src/apps.json#L3423
我对Python并不擅长,但我想第1,2和3点很容易检查(检查主页源中存在和的用法)。如果您收到403 Forbidden
文件夹,请尝试一个显然不存在的文件夹:如果它返回404 Not Found
,那么403 Forbidden
肯定是现有目录。或者确定一个应该始终在此文件夹中的文件并检查其存在。
永远不要认为结果是100%确定......