Question

目前正在尝试编写一个可以从给定的URL中提取CSS / JSS的python脚本。曾经偶然发现urllib3帮助我在他们的PoolManager（）实用程序的帮助下收集给定URL的HTML。使用下面的简短代码，我能够提取给定URL的HTML，然后将其存储在文件中。

import urllib3
http = urllib3.PoolManager()
x = http.request('GET','www.something.com')
x.data

我在official page上查看了urllib3的文档。然而，关于我正在寻找的各种功能并没有太多。现在我需要以某种方式获取特定URL的外部资源，我想知道是否可以使用urllib3，或者我是否需要搜索其他可以帮助我做同样的事情（欢迎任何建议）

先谢谢大家！

Answer 1

这不是你用urllib3做的事情。一旦获得了HTML，就必须解析它并提取链接到CS和JS文件的元素。您可以使用BeautifulSoup。