解压缩与python的HTML链接

时间:2017-11-30 11:54:14

标签: python python-3.x python-requests zipfile

我有一个HTML网页,表格中有许多下载链接。我已经隔离了我想要的拉链的路径。它们都包含.xlsx文件,但有时包含其他文件。

  1. 有没有办法避免下载拉链并直接访问里面的文件?

  2. 如果我确实需要下载它们,如何跟踪拉链的下载位置? (所以我可以提取.xlsx)

  3. 我目前正在研究zipfilerequests的解决方案。 zipfile.extract需要zip文件的路径,但我不确切知道脚本将下载到哪里。 requests给出了一个响应对象,但如何提示它下载?

1 个答案:

答案 0 :(得分:1)

  

有没有办法避免下载拉链并直接访问里面的文件?

一般来说:不。 Web服务器提供文件系统中的文件,而不是zip存档中的文件。

  

如果我确实需要下载它们,如何跟踪拉链的下载位置? (所以我可以提取.xlsx)

如果未指定,则该位置是当前目录,即已启动脚本的目录。