我试图使用beautifulsoup从网站获取javascript“.js”文件。这是我目前正在使用的代码,但是在某些文件上有所遗漏
jss = soup.findAll(name = 'script', attrs = { 'src': re.compile('\.js') })
例如js file:
src=http://krebsonsecurity.com/wp-content/plugins/comment-rating-pro/ck-karma.js?ver=3.3.2
然后它错过了。
任何人都知道能够提取js文件的最佳实现。
干杯
答案 0 :(得分:0)
删除src
的值限制(超出"有src")。
re.compile('\.+')