如何使用bash命令删除INSIDE html标记中的空格

时间:2013-04-20 23:54:44

标签: bash

我遇到了一个html解析器程序的问题。我的html标签上写有< p><p >:白色空间给我带来了问题。

是否有一种简单的方法可以在单个bash命令中使用sed之类删除这些空格?

2 个答案:

答案 0 :(得分:3)

这是一个修剪无属性标签内的前导和尾随空格的方法。

$ echo '< p> </ p> <p > < /p>' | sed -E 's|<(/?) *([^ >]*) *>|<\1\2>|g'
<p> </p> <p> </p>

答案 1 :(得分:0)

不,有太多边缘情况,引号和转义字符会破坏您的结果。对于你得到的每个答案,有一些容易找到的例子可以打破它们。有关完整讨论,请参阅RegEx match open tags except XHTML self-contained tags