我想了解以下代码的作用。此逻辑是从电子邮件正文中删除html的例程的一部分。
mBBSREgEx.IgnoreCase = True
mBBSREgEx.Global = True
mBBSREgEx.Pattern = "<[^>]*>"
sResult = mBBSREgEx.Replace(sResult, "")
谢谢你, 吉姆
好的,如果我想更改例程以去除像[b] Hello [/ b]那样构造的标签,而不是现有的标记为“&lt;”的标签。和“&gt;”标签,我该如何更改模式?
这会有用吗?
mBBSREgEx.Pattern = "\[[^\]]*\]"
谢谢, 吉姆
答案 0 :(得分:4)
它用空字符串替换所有标记。
它会查找一个开头<
,然后尽可能多地填充不是>
的字符,然后找到一个结束>
。最后,它用空字符串替换了所有这些(从<
到>
的所有内容),有效地剥离了HTML标记。
答案 1 :(得分:0)
以下模式将删除构造为[b] Hello [/ b]的标签,而不是剥离“&lt;”的现有标签。和“&gt;”标记:
mBBSREgEx.Pattern = r"\[[^\]]*\]"