我正在使用Coldfusion
以下语法似乎删除了str
变量的所有HTML标记:
ReReplaceNoCase(#str#,"<[^>]*(?:>|$)","","ALL")>
但是,我希望<div>
和</div>
保持完整。我怎么能这样做?
答案 0 :(得分:0)
我建议使用JSoup而不是正则表达式。它使得解析和操作html片段变得更加容易。
下载并安装JSoup。使用您希望保留的代码创建Whitelist。然后使用JSoup.clean(...):
清除html字符串jsoup = createObject("java", "org.jsoup.Jsoup");
whiteList = createObject("java", "org.jsoup.safety.Whitelist");
cleanString = jsoup.clean( yourHTMLString, Whitelist.none().addTags( [ "div" ] ));
writeDump( cleanString );