从给定的URL中提取CSS / JSS

时间:2015-06-18 15:36:09

标签: python extraction urllib3

目前正在尝试编写一个可以从给定的URL中提取CSS / JSS的python脚本。曾经偶然发现urllib3帮助我在他们的PoolManager()实用程序的帮助下收集给定URL的HTML。使用下面的简短代码,我能够提取给定URL的HTML,然后将其存储在文件中。

import urllib3
http = urllib3.PoolManager()
x = http.request('GET','www.something.com')
x.data

我在official page上查看了urllib3的文档。然而,关于我正在寻找的各种功能并没有太多。现在我需要以某种方式获取特定URL的外部资源,我想知道是否可以使用urllib3,或者我是否需要搜索其他可以帮助我做同样的事情(欢迎任何建议)

先谢谢大家!

1 个答案:

答案 0 :(得分:0)

这不是你用urllib3做的事情。一旦获得了HTML,就必须解析它并提取链接到CS和JS文件的元素。您可以使用BeautifulSoup