机器人框架 - 如何使用删除字符串使用Regexp关键字从html中删除javascript标记

时间:2015-07-16 13:08:30

标签: regex robotframework

我正在研究一个访问页面的测试用例,获取页面源并将其保存到html文件中。在保存源代码之前,我需要删除&#34;&#34;中的所有javascript。到&#34;&#34;。我已经浏览了大量的在线资源并提出了<script type="text/javascript">([\\s\\S]*?)<\\/script>,但我在测试用例中输入的正则表达式语法似乎不起作用。有没有人有任何建议?

更多信息: 页面源代码包含许多JavaScript实例并跨越多行,因此我认为我需要在表达式前加(ims)。在我上面的解决方案中,您还会看到我已经从反倾斜中逃脱了,因为我在某处读到了必要的内容。

源代码示例

&#13;
&#13;
<html>
<script type="text/javascript">
some multiline javascript
  </script>
<script type="text/javascript"> some single line javascript  </script>
<body>
body content
</body>
<script type="text/javascript">
some more javascript
</script>
&#13;
&#13;
&#13;

1 个答案:

答案 0 :(得分:1)

这是我的尝试:

"<script[^>]*>[^\0]*?<\/script>", gi

Regex live here.

解释

#   <script              # match the start of the tag
#   [^>]*>               # match anything till the ">" character
#   [^\0]*?<\/script>    # match anything (not null) till the closing tag

希望它有所帮助。