如何从html文档中删除空格

时间:2013-11-28 17:19:21

标签: regex

我正在尝试找到一个有效的正则表达式,我可以用来去除所有空格或换行符。

以下是我尝试的内容。

(适用(\ S | \ n | \ r)的≤(\ S | \ n | \ r)的?)|(\ S | \ n | \ r)的<?EM>&GT;(\ S | \ n | \ r)的

本文件

< tag src="abc" testattribute >


<script > any script </script >

<tag2>what is this </tag2>
<tag>

我希望最终结果正是这样。

<tag src="abc" testattribute><script>any script</script><tag2>what is this</tag2><tag>

1 个答案:

答案 0 :(得分:2)

您可以在此处使用\s来匹配空格。

\s matches whitespace (\n, \r, \t, \f, and " ")

根据您使用的语言,您可以使用断言。

(?<=<|>)\s*|(?<!>|<)\s*(?![^><])

请参阅live demo

正则表达式:

(?<=           look behind to see if there is:
 <             '<'
  |             OR
 >             '>'
)              end of look-behind
 \s*           whitespace (\n, \r, \t, \f, and " ") (0 or more times)
 |             OR
(?<!           look behind to see if there is not:
 >             '>'
  |            OR
 <             '<'
)              end of look-behind
 \s*           whitespace (\n, \r, \t, \f, and " ") (0 or more times)
 (?!           look ahead to see if there is not:
  [^><]        any character except: '>', '<'
 )             end of look-ahead