WGET:如何下载链接和子链接?

时间:2015-04-15 01:33:47

标签: wget

我使用WGET下载网站上的数据,然后将其另存为HTML文件。数据以表格形式呈现。该表由三列组成:id_sales,sales_name,number_of_buyers。如果单击number_of_the买家列中的数字,将显示详细数据。我想下载表单和数据详细信息中的数据。为了能够看到数据,我必须先登录。

enter image description here

我的剧本:

@echo off

SET office_id=613
set userid=123456
set password=p@ssw0rd

set save_cookies="cookies\cookies.txt"
wget --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" --post-data="username=%userid%&password=%password%&sublogin=Login" --save-cookies=%save_cookies% --keep-session-cookies http://app/login/login/loging_simpel

wget  --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" -r -E -nd --load-cookies=cookies\cookies.txt --save-cookies=cookies\cookies.txt --keep-session-cookies "http://app/portal/credit/result.php?office_id=613&years=2013"

pause

以上脚本只能下载数据表。但细节未下载。请帮我纠正这个脚本。非常感谢你

1 个答案:

答案 0 :(得分:0)

可以使用Lynx或链接将html表转换为文本,但理想情况下我建议投资使用Scrapy

进行编写