wget从不同的网页中提取数据

时间:2015-02-25 21:13:24

标签: php cookies web-scraping wget

我目前正在使用wget从受密码保护的网站中提取数据。遗憾的是,保存的数据并非来自正确的网页。例如,当我输入:

wget -O filename.txt --cookies=on --load-cookies=./cookies.txt http://www.draftexpress.com/blue/player.php?player=1086&year=2015&split=totals

它会保存http://www.draftexpress.com/blue/player.php?player=1086的网页数据。谁知道我可能做错了什么?我对wget很新,所以任何帮助都会非常感激!

1 个答案:

答案 0 :(得分:0)

您需要将用户名和密码传递给网站才能获得身份验证。您目前获得的回复基本上是网站上说您的访问权被拒绝。您可以将wget --user= --password=添加到参数列表中。