如何从网站上抓取cgi python脚本?

时间:2013-11-21 09:22:03

标签: python selenium cgi web-scraping

我刚刚开始学习使用硒进行网页编写和机械化,效果很好。我想知道是否有可能从网站上抓取一个cgi python脚本,所以我可以离线复制网站功能。

这是一个示例脚本。

http://www.tutorialspoint.com/cgi-bin/hello.py

当我尝试抓取此文件时,我从脚本而不是脚本本身获取html输出。这是:

<html>
<head>
<title>Hello Word - First CGI Program</title>
</head>
<body>
<h2>Hello Word! This is my first CGI program</h2>
</body>
</html>

可以在此处找到python脚本的详细信息:

http://www.tutorialspoint.com/python/python_cgi_programming.htm

如果您能提供任何见解,我将非常感激。

由于

1 个答案:

答案 0 :(得分:1)

每个站点由两部分组成:后端和前端。

“后端”在服务器端意味着通常是PHP,Python,ASP或JSP语言。

“前端”是指客户端:HTML,JavaScript和CSS。

你作为一个冲浪者只看前端,这就是你所刮的。您无法访问后端。