Question

我想了解以下代码的作用。此逻辑是从电子邮件正文中删除html的例程的一部分。

mBBSREgEx.IgnoreCase = True
mBBSREgEx.Global = True
mBBSREgEx.Pattern = "<[^>]*>"
sResult = mBBSREgEx.Replace(sResult, "")

谢谢你，吉姆

好的，如果我想更改例程以去除像[b] Hello [/ b]那样构造的标签，而不是现有的标记为“＆lt;”的标签。和“＆gt;”标签，我该如何更改模式？

这会有用吗？

mBBSREgEx.Pattern = "\[[^\]]*\]"

谢谢，吉姆

Answer 1

它用空字符串替换所有标记。

它会查找一个开头<，然后尽可能多地填充不是>的字符，然后找到一个结束>。最后，它用空字符串替换了所有这些（从<到>的所有内容），有效地剥离了HTML标记。

Answer 2

以下模式将删除构造为[b] Hello [/ b]的标签，而不是剥离“＆lt;”的现有标签。和“＆gt;”标记：

mBBSREgEx.Pattern = r"\[[^\]]*\]"