用sed格式化html

时间:2009-02-19 13:19:56

标签: html sed

如何使用sed在每个与表相关的标记之前在html文件中插入换行符?

3 个答案:

答案 0 :(得分:1)

sed -e "s/<\\(table\\|td\\|tr\\)/\\
<\\1/gi"

添加您感兴趣的其他元素名称。不是100%完美:它不适合所有HTML怪异,但是sed永远不够。

答案 1 :(得分:1)

匹配开放和&amp;结束标签:

sed "s/\(<\/\?\(table\|tr\|td\)\)/\n&/gi"

仅打开标签:

sed "s/\(<\(table\|tr\|td\)\)/\n&/gi"

仅关闭代码:

sed "s/\(<\/\(table\|tr\|td\)\)/\n&/gi"

答案 2 :(得分:0)

这应该是一个基本的解决方案

sed -s "s/<\(\/\?\)\(t\)/\n<\1\2/gi"

不是100%完美,因为它会忽略col,colgroup并捕获telytype标签,但很可能你没有使用它们。