我有自动生成的HTLM格式的大量文档(大约900页)。
输出html通常包含HTML编码的HTML标记。例如,您可以看到<br/>
而不是<br/>
。这个错误是非常随意的,有时会产生好的,有时甚至是坏的。
生成器工具是第三方应用程序(Enterprise Architect),我对生成过程有一些但影响非常有限。例如,我能够更改文档的DocType,我可以添加一些JavaScript。有没有办法强制浏览器将<br/>
解释为正确的BR标记?
答案 0 :(得分:1)
您可以编写一个控制台应用程序,它将遍历文件并修复不正确的HTML。那可能是我接近它的方式。