我刚刚开始学习使用硒进行网页编写和机械化,效果很好。我想知道是否有可能从网站上抓取一个cgi python脚本,所以我可以离线复制网站功能。
这是一个示例脚本。
http://www.tutorialspoint.com/cgi-bin/hello.py
当我尝试抓取此文件时,我从脚本而不是脚本本身获取html输出。这是:
<html>
<head>
<title>Hello Word - First CGI Program</title>
</head>
<body>
<h2>Hello Word! This is my first CGI program</h2>
</body>
</html>
可以在此处找到python脚本的详细信息:
http://www.tutorialspoint.com/python/python_cgi_programming.htm
如果您能提供任何见解,我将非常感激。
由于
答案 0 :(得分:1)
每个站点由两部分组成:后端和前端。
“后端”在服务器端意味着通常是PHP,Python,ASP或JSP语言。
“前端”是指客户端:HTML,JavaScript和CSS。
你作为一个冲浪者只看前端,这就是你所刮的。您无法访问后端。