我有这段代码:
use strict;
use LWP::UserAgent;
use warnings;
my $ua = new LWP::UserAgent(agent => 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.0.5) Gecko/20060719 Firefox/1.5.0.5');
$ua->proxy([qw(http https)] => 'http://59.39.92.148:1080');
my $response = $ua->get("http://www.google.com");
print $response->code,' ', $response->message,"\n";
代码的含义是“使用sock代理打开www.google.com”吗?解释是什么?
答案 0 :(得分:3)
它正在实例化一个LWP::UserAgent对象。
参数指定浏览器 Mozilla Firefox
连接代理的地址和端口'http://59.39.92.148:1080'
并且响应是Google通过代理传递的:
我的$ response = $ ua-> get(“http://www.google.com”);`
最后:
print $response->code,' ', $response->message,"\n";`
允许将回复提交给用户
我是C#开发人员,但这就是我的看法:)
答案 1 :(得分:2)
该代码正在设置一个LWP::UserAgent对象,以伪装成人类用来绕过Google的蜘蛛检测机制的浏览器。这样做会违反Google's Terms of Service:
5.3您同意不通过Google提供的界面以外的任何方式访问(或尝试访问)任何服务,除非您在与Google的单独协议中明确允许这样做。您明确同意不通过任何自动方式(包括使用脚本或网络爬虫)访问(或尝试访问)任何服务,并应确保您遵守服务中存在的任何robots.txt文件中的说明。
59.39.92.148
可能是中国的一些受损(或配置不当)的开放代理。将$ua
设置为使用它是为了隐藏TOS违规的来源。
顺便提一下,您应该知道59.39.92.148
处的服务器将能够记录并跟踪您的所有请求和响应,如果您决定沿着此路线前进。
更重要的问题是:你想做什么?
答案 2 :(得分:1)
看起来像:使用HTTP代理打开“www.google.com”