Question

我有这个代码匹配HTML的所有开始和结束标记：

preg_match_all("/(<[a-zA-Z\/][^>]*>)/imu", $sentance, $start_tag_list, PREG_PATTERN_ORDER);

但我希望它忽略以：</

开头的标签

Answer 1

这是您当前的正则表达式（在Debuggex上）：

Regular expression visualization

它将接受任何HTML标记，其中第一个字符是字母（a-zA-Z）或斜杠（/），后跟除>之外的任何内容。

如果你只是从接受的第一个字符中删除斜杠，你会得到：

<[a-zA-Z][^>]*>

Regular expression visualization