我正在使用以下RegEx从字符串中删除HTML标记
<[^>]*>
然而,这并没有消除空白行。我发现其他RegEx成功删除了任何空行:
[#Chr(13)##Chr(10)#]+
我试图将两者结合起来:
ReReplaceNoCase(arguments.string, "(<[^>]*>)([#Chr(13)##Chr(10)#]+)", "", "ALL")
但这不起作用。我正在使用ColdFusion执行此操作,这应该解释#
符号。
我认为()
用于在RegEx中对运算符进行分组,但在尝试合并这两个表达式时似乎没有用。
答案 0 :(得分:1)
假设您可以按照自己的意愿使用两个正则表达式,那么可以使用替换方法将它们组合在一起:
<[^>]*>|[#Chr(13)##Chr(10)#]+
我强烈怀疑你发布的的正则表达式实际上是否正常工作。我建议你不使用正则表达式解析HTML,因为HTML不是常规语言。改为使用HTML解析器。
答案 1 :(得分:1)
stripcr(ReReplaceNoCase(arguments.string, "(<[^>]*>)", "", "ALL"))