似乎wget
无法获取asp
文件,而html
没有问题。我编写了一个脚本来获取一些URL并以csv
格式保存它们。
脚本是
wget -qO- http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1 | sed 's+<br />++g' > $1.csv
答案 0 :(得分:1)
您必须在该网址周围加上引号!如果没有引用,Bash(或者你正在使用的任何shell)会将&
视为在后台运行wget
的请求 - 而&
之后的格式参数永远不会发送到服务器。试试这个:
wget -qO- 'http://www.wunderground.com/weatherstation/WXDailyHistory.asp?ID=KPAPALMY1&format=1' | sed 's+<br>++g' > $1.csv
请注意,我也调整了您的sed
命令 - 您获得的<br>
没有终止斜杠。另外:删除那些<br>
表示只有每个其他行都有数据。希望这不会有问题,因为删除带有sed
的换行符有点痛苦,但如果是,请参阅this question了解如何操作。
希望有所帮助!