我有这个代码匹配HTML的所有开始和结束标记:
preg_match_all("/(<[a-zA-Z\/][^>]*>)/imu", $sentance, $start_tag_list, PREG_PATTERN_ORDER);
但我希望它忽略以:</
答案 0 :(得分:1)
这是您当前的正则表达式(在Debuggex上):
它将接受任何HTML标记,其中第一个字符是字母(a-zA-Z
)或斜杠(/
),后跟除>
之外的任何内容。
如果你只是从接受的第一个字符中删除斜杠,你会得到:
<[a-zA-Z][^>]*>