我有一个任意大的HTML字符串,其中包含错误的转义属性值。我想获得具有正确转义属性值的完整HTML字符串。我想用Java做到这一点。
例如,鉴于此错误转义的HTML标记:
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
我想要这个输出:
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
StringEscapeUtils.escapeHtml()或replaceAll()替换所有无效的HTML字符,如下所示:
<p name="Chalupa "Batman" McArthur">Chalupa "Batman" McArthur</p>
我希望属性值中的字符正确转义,但HTML的其余部分单独留下,以便浏览器可以正确处理。是否有可以处理此问题的java库?