是否有任何开源库可以将恶意HTML转换为格式良好(不仅仅是漂亮的)HTML,就像firebug一样?
例如,
<tr class=row><td>content</tr>
可能会成为
<tr class="row"><td>content</td></tr>
答案 0 :(得分:0)
你不能使用javascript来修复破坏的DOM,因为javascript首先依赖于DOM是有效的。您确实需要查看系统的服务器端部分,如果那是输出无效的HTML,那么这就是您需要修复的系统部分。
如果你的意思是你希望你的标记打印得很漂亮,假设你正在使用PHP,你可以安装Tidy扩展(http://php.net/manual/en/book.tidy.php )。如果您不能或不想安装扩展,或者没有运行PHP但是使用的脚本语言可以运行shell命令,那么您可以使用外部shell命令,例如htmltidy(http:// en。 wikipedia.org/wiki/HTML_Tidy)