我遇到了一个html解析器程序的问题。我的html标签上写有< p>
和<p >
:白色空间给我带来了问题。
是否有一种简单的方法可以在单个bash命令中使用sed之类删除这些空格?
答案 0 :(得分:3)
这是一个修剪无属性标签内的前导和尾随空格的方法。
$ echo '< p> </ p> <p > < /p>' | sed -E 's|<(/?) *([^ >]*) *>|<\1\2>|g'
<p> </p> <p> </p>
答案 1 :(得分:0)
不,有太多边缘情况,引号和转义字符会破坏您的结果。对于你得到的每个答案,有一些容易找到的例子可以打破它们。有关完整讨论,请参阅RegEx match open tags except XHTML self-contained tags。