以下Regex表达式有什么作用?

时间:2010-06-12 03:21:47

标签: regex

我想了解以下代码的作用。此逻辑是从电子邮件正文中删除html的例程的一部分。

mBBSREgEx.IgnoreCase = True
mBBSREgEx.Global = True
mBBSREgEx.Pattern = "<[^>]*>"
sResult = mBBSREgEx.Replace(sResult, "")

谢谢你, 吉姆

好的,如果我想更改例程以去除像[b] Hello [/ b]那样构造的标签,而不是现有的标记为“&lt;”的标签。和“&gt;”标签,我该如何更改模式?

这会有用吗?

mBBSREgEx.Pattern = "\[[^\]]*\]"

谢谢, 吉姆

2 个答案:

答案 0 :(得分:4)

它用空字符串替换所有标记。

它会查找一个开头<,然后尽可能多地填充不是>的字符,然后找到一个结束>。最后,它用空字符串替换了所有这些(从<>的所有内容),有效地剥离了HTML标记。

答案 1 :(得分:0)

以下模式将删除构造为[b] Hello [/ b]的标签,而不是剥离“&lt;”的现有标签。和“&gt;”标记:

mBBSREgEx.Pattern = r"\[[^\]]*\]"