正则表达式:标识除,或之外的所有html标记

时间:2015-02-12 04:29:12

标签: java regex html-parsing

我想问除了 <tr>, <td>, </td>, or </tr>

之外如何删除所有html标签

我可以 - 使用<.*?>识别所有html标签 - 使用<tr>, <td>, </td>, </tr>确定^((?!<tr>)(?!<td>)(?!</td>)(?!</tr>).)*$

但我只是不知道如何将两个标准合二为一。

非常感谢。

1 个答案:

答案 0 :(得分:0)

以下正则表达式将匹配所有标签,但不匹配td或tr。

<(?!\/?(?:t[dr])>).*?>

DEMO