我正在使用Ubuntu并拥有known URL我需要下载/另存为CSV。 URL基于参数并经常为项目更改,因此我想编写一个执行下载的脚本,这样我就不必每次都手动保存它。
我试图使用wget来获取文件,但网站将内容显示为CSV,而文件本身是HTML。如何将页面内容保存为纯csv?
wget -O my.csv [url]
有人可以帮忙吗?
答案 0 :(得分:1)
在每行末尾,文件中唯一的HTML似乎是<br />
。要删除它,你可以
wget -O- "$URL" | sed 's#<br />$##' > my.csv