我想制作一个脚本(用任何语言,但最好是python或perl)下载由网页流式传输的特定类型的文件。但是,我不知道这个文件的位置,所以我必须通过查找页面流式传输的所有文件,并根据文件类型选择我想要的文件来找到它。
一个类似的例子就是说我想从youtube上下载一个视频,但除了查找正在流式传输到我的计算机的文件之外,没有任何模式或方法可以找到该URL。
我无法弄清楚的部分是如何查找页面流式传输的所有文件。其余的我可以自己做。在html页面的源代码中没有提到文件名。
问题的例子......
这很好用:
import urllib
urllib.urlretrieve ("http://example.com/anything.mp3", "a.mp3")
然而,这不是:
import urllib
urllib.urlretrieve ("http://example.com/page-where-the-mp3-file-is-being-streamed.html", "a.mp3")
如果有人可以帮我弄清楚如何从页面下载所有文件或找到正在流式传输的文件,我会非常感激。 我只需要知道哪种语言/库/方法可以实现这一点。谢谢