我有一个字符串,里面装满了Javascript文件的脚本标签,我想用.min.js替换.js的所有实例。我不能假设字符串的内容格式如下所示。所以我需要将替换限制在src = part。
中我假设正则表达式最适合这个,但我将如何进行查找,然后替换所有实例?
<script type=\"text/javascript\" src=\"../../Scripts/json.js\"></script><script type=\"text/javascript\" src=\"../../Scripts/Logger.js\"></script> <script type=\"text/javascript\" src=\"../../Scripts/PageHelper.js\"></script>
另一个考虑因素是我不想替换已经定义为min.js的.min.js。
答案 0 :(得分:0)
免责声明:我不建议使用正则表达式进行HTML解析...
如果脚本标记引号未转义(它们不应该转义),则应该可以使用
======================
原始正则表达式
<script(?=\s)(?=((?:[^>"']|"[^"]*"|'[^']*')*?)(?<=\s)src\s*=(?:(?>\s*(['"])\s*((?:(?!\g{-2}).)+)(?<!\.min)\.js\s*\g{-2})|(?>(?!\s*['"])\s*([^\s>]*)(?<!\.min)\.js(?=\s|>)))((?>(?:".*?"|'.*?'|[^>]?)+)))(?>\s+(?:".*?"|'.*?'|[^>]*?)+>)(?<!/>)
原始替代
<script$1src="$3$4.min.js"$5>
修饰符'',单行(表示全点)
扩展正则表达式
<script
(?=\s)
(?=
( (?: [^>"']|"[^"]*"|'[^']*')*? ) (?<=\s) # (1) - before 'src'
src \s*=
(?:
(?> \s* (['"]) \s* ((?:(?!\g{-2}).)+ ) (?<!\.min)\.js \s* \g{-2} ) # (2,3)
| (?> (?!\s*['"]) \s* ([^\s>]*) (?<!\.min)\.js (?=\s|>) ) # (4) - use $3.$4
)
( (?> (?:".*?"|'.*?'|[^>]?)+ ) ) # (5) - after 'src'
)
(?> \s+ (?:".*?"|'.*?'|[^>]*?)+
>
) (?<! /> )
或......
<script
(?= \s )
(?=
1 (
(?: [^>"'] | " [^"]* " | ' [^']* ' )*?
1 )
(?<= \s )
src\s*=
(?:
(?>
\s*
2 ( ['"] )
\s*
3 (
(?:
(?! \g{-2} )
.
)+
3 )
(?<! \.min )
\.js\s*\g{-2}
)
|
(?>
(?! \s* ['"] )
\s*
4 ( [^\s>]* )
(?<! \.min )
\.js
(?= \s | > )
)
)
5 (
(?>
(?: ".*?" | '.*?' | [^>]? )+
)
5 )
)
(?>
\s+
(?: ".*?" | '.*?' | [^>]*? )+
>
)
(?<! /> )