我们正在使用python硒和OWASP ZAP API自动扫描站点。最后,我们将使用下面的代码生成html问题报告。
file1.write(zap.core.htmlreport(apikey=apikey))
唯一的问题是,报告中包含过多不必要的网址,例如googleapis,facebook,typekit等...
我们真的要排除这些URL,我们创建一个新的ZAP上下文,并尝试将URL排除为:
z.context.exclude_from_context(contextname=cname, regex=regex, apikey=apikey)
正则表达式为正则表达式,例如:
^http(s)?:\/\/([a-z0-9\-]+.)+(facebook|google).(com|net)\/?
但是它不起作用。...html仍然包含URL
有人可以帮助我吗?我们要排除这些URL或仅在html报告中包含我们需要的URL
答案 0 :(得分:1)
解决了与Python类似的问题。 我可以提供发生的情况: “(((http [s]?| ftp)://)?([^-:/] [^:/ \ s] +)。\ w +(((/ \ w +)* /)([\ w-。 ] + [^ \ s:] +)?“
此外,还有一些来自不同作者的带有正则表达式的选择,也许有些方法可以工作,但是它们看上去并不十分顺畅: https://mathiasbynens.be/demo/url-regex
在这里我进行了测试,结果发现非常方便: https://regex101.com/