我有一个VPS,它有3个不同的IP地址。 我有一个python脚本,每1小时抓取一个特定的网站 例如,这是我的python请求:
LOAD DATA LOCAL INFILE 'D:\\Bets\\BD\\tables\\match.csv'
INTO TABLE `bets`.`match`
FIELDS TERMINATED BY ';' OPTIONALLY ENCLOSED BY '"' ESCAPED BY '"'
LINES TERMINATED BY '\r\n'
(`idMatch`, `idChampionship`, @date, `homeTeam`,
`awayTeam`,`homeTeamGoals`, `awayTeamGoals`, `matchType`)
SET matchDate = STR_TO_DATE(@date, 'YYYY-MM-DD');
我唯一想要的是每次我的python流量从服务器中流出它随机使用该IP地址
答案 0 :(得分:1)
因此,经过长时间的审议,我可以向您指出一些资源,希望能引导您找到答案。很难对这个问题给出明确的答案,因为我不知道你正在使用什么样的虚拟基础设施或网络是什么样的。
Here是一个有类似欲望的主题,但最终没有得到答复。但是,很明显,如果您使用AWS,则需要使用VPC。并且您必须以特殊方式配置您的ENI以间歇性地使用您的公共IP地址,以了解有关VPC中ENI的更多信息,请参阅here
This article详细说明了您要完成的任务,但使用的是具有特殊NAT配置的Vyatta路由器。还有一个提到能够使用高级iptables规则来实现这一点,这可能值得研究。
无论如何,您无法使用正在执行爬网的脚本内部的各种公共IP地址来完成流量传输。要产生这种效果,您需要以某种方式以某种方式修改主机网络配置(高级iptable规则或定期更改默认路由),更改虚拟路由器的配置(特殊NAT /路由规则),或使用特定于您的方法虚拟主机平台(Amazon VPC)。