我正在使用HTMLPurifier来清理帖子输入,但我希望它能够转义(html编码)所有损坏的标签或可疑符号,而不是完全删除它们。我搜索了它的文档和这个网站,但没有任何运气。仍然希望我错过了一些东西。
打开标签是最烦人的。如果有人试图发布公式或比较,写入“param1< param2”并且不在其间放置空格,则净化器将其作为错误的标记打开并完全丢弃右侧的所有内容。
我在[code]标签中使用htmlspecialchars,但我想在外面允许一些html并且不能编码所有内容..这就是为什么我用HTMLPurifier过滤它。 您的建议将不胜感激。
答案 0 :(得分:0)
尝试使用%Core.AggressivelyFixLt或将%Core.LexerImpl设置为DirectLex。我不知道这是否有效,可能不会。
部分解决方案是设置%Core.EscapeInvalidTags;但这是一个非常不完美的修复,它可能会破坏一些文本。