我正在查看HtmlPurifier文档,但我对此一无所知。
假设我有
<div class="codebox">
All html tags here - Even <div class="codebox">another code box</div>
</div>
我想解析第一个<div class="codebox">
的内容,以便它可以作为明文阅读。
htmlpurifier能做到吗?
答案 0 :(得分:0)
开箱即用HTMLPurifier无法做到这一点,并且我知道没有配置设置,只能将第一个<div>
标记转换为纯文本而不转换整个文档。即使将整个文档转换为文本,也不需要也不建议使用HTMLPurifier。
您可以扩展HTMLPurifier的功能,但除非您是专家编码员,否则我不建议您这样做。
但是,如果要将HTML文档的一部分转换为文本,则将其分解为多个部分并运行要通过
strip_tags()
上的PHP手册页
您可以使用此配置指令将文档中的所有div标记转换为纯文本:
$config->set(HTML.ForbiddenElements, 'div'); //This will black list 'div' tag
如果您绝对坚持使用HTMLPurifier将整个文档转换为文本,那么这里就是配置指令。
$config->set('HTML.Allowed', ''); //This will white list NO tags ''