如何从html页面获取wget下载链接?

时间:2012-03-29 19:19:22

标签: wget

我已经安装了wget以及一个firefox插件来获取wget代码来下载页面。我也添加了一些选项,但wget只下载源页面,当我查看源页面时,它有以下奇怪的字符:

<-_oÛ6Àßý)n,°§ÕìŸt:ÙC“©•$EŸš¢ - ”©'TR÷Óï(ÉNè-šéAäÝ'âïî(Rý-,ãüËU) Y〜qWŸÎÎ1-” ~~ SSAI DVU†Òô'Ì '' ×} -z&安培; O 3(_äçéüZ:Q 3&安培;¢½:‰©nÁjF¬ÛUÂ-B8¥>)kÞSz¥? ¬0PnÊuM¹μþ™âCÂUJmoH®·kČȚmýú²·YTQ?IO »OA'd2‰I-ESS +Íoÿmμ^ {UHA {1}}å7TÞÃhoøÓ{§-yºBa=ŸIAÂÚc8úOE-üKþåÆgÑOn¼-ÌóRXißCÄ〜II-ŒäLÝdÒ:!MVT *gtÑr'μB“÷ÚÓÒÕñCÜ+ @oÀyE>FæçF “Í1'ƒG#ÏrÃ8ò˜‘¬" |RošOp9þìQ,ļJÞáí²z$ q¢NÐ...kƒ»Ö;HÌV8?¼}¼ñQiöÅPq&gt;þN7dÑââ#\ââ°~BÛt+7²tñ1˱°yMàó”ɳ9ù<ÀÙr•¤ «yEæýÑÚ×1äGõÑ~«¼37²〜¼¬†ÌÁ½½/°°f£])‡[ÖUª“ÿ½ÿ{ä

我之前也遇到过这个问题。这是我正在使用的命令。

wget -e robots = off -m --wait 1 -H -l1 --tries = inf --retry-connrefused -r --convert-links --append-output = C:\ legalassetlog.txt - header =“Host:sitename”--header =“User-Agent:Mozilla / 5.0(Windows NT 6.0; rv:11.0)Gecko / 20100101 Firefox / 11.0”--header =“Accept:text / html,application / xhtml + xml,application / xml; q = 0.9, / ; q = 0.8“--header =”Accept-Language:en-us,en; q = 0.5“--header =”Accept-Encoding :gzip,deflate“--header =”DNT:1“--header =”Connection:keep-alive“--header =”Referer:site“”site“--content-disposition

原始页面有许多其他基本的html链接,但是wget不会下载其中任何一个。 我该怎么做才能解决这个问题?

0 个答案:

没有答案