我想知道是否有一个简单的名称来列出HTTP文件共享中的所有文件/目录 - 默认情况下,HTTP服务器显示它们但我想知道是否有一种简单的方法来获取文件列表无需手动解析返回的网页。
任何使用curl
,wget
或python
的解决方案应该没问题。
答案 0 :(得分:1)
不,没有通用的方法来做到这一点。
答案 1 :(得分:1)
wget仅用于下载不列出目录的文件。
如果这就是你所拥有的,但是......
wget -r http://SOME.SITE/PATH 2>&1 | grep 'Saving to:' | sed "s/Saving to: \`\([^?']*\).*'/\1/" | uniq -u
rm -rf SOME.SITE
(只是因为你以后没有起诉我,从网站上下载所有文件而然后删除它们)
编辑:抱歉,我累了。如果您只想 顶级目录,您可以执行以下操作:
wget -rq http://SOME.SITE/PATH
ls -1p SOME.SITE | grep '/$'
rm -rf SOME.SITE
这与上面相同,但仅列出URL的直接子目录。