Question

我正在使用以下RegEx从字符串中删除HTML标记

<[^>]*>

然而，这并没有消除空白行。我发现其他RegEx成功删除了任何空行：

[#Chr(13)##Chr(10)#]+

我试图将两者结合起来：

ReReplaceNoCase(arguments.string, "(<[^>]*>)([#Chr(13)##Chr(10)#]+)", "", "ALL")

但这不起作用。我正在使用ColdFusion执行此操作，这应该解释#符号。

我认为()用于在RegEx中对运算符进行分组，但在尝试合并这两个表达式时似乎没有用。

Answer 1

假设您可以按照自己的意愿使用两个正则表达式，那么可以使用替换方法将它们组合在一起：

<[^>]*>|[#Chr(13)##Chr(10)#]+

我强烈怀疑你发布的的正则表达式实际上是否正常工作。我建议你不使用正则表达式解析HTML，因为HTML不是常规语言。改为使用HTML解析器。

Answer 2

stripcr(ReReplaceNoCase(arguments.string, "(<[^>]*>)", "", "ALL"))