使用beautifullsoup和python从网站/文件中提取.js文件

时间:2012-05-09 05:51:35

标签: javascript python beautifulsoup

我试图使用beautifulsoup从网站获取javascript“.js”文件。这是我目前正在使用的代码,但是在某些文件上有所遗漏

jss = soup.findAll(name = 'script', attrs = { 'src': re.compile('\.js') })

例如js file:

src=http://krebsonsecurity.com/wp-content/plugins/comment-rating-pro/ck-karma.js?ver=3.3.2
然后它错过了。

任何人都知道能够提取js文件的最佳实现。

干杯

1 个答案:

答案 0 :(得分:0)

删除src的值限制(超出"有src")。

re.compile('\.+')