我正在使用nekohtml解析器来解析我的html代码。有时我使用锚标记时的错误,内容就像这样写了。
<a href="http://abc.com"><a href="http://abc.com">abc</a></a>
解析nekohtml之后,我希望内容能够像这样纠正。
<a href="http://abc.com"></a><a href="http://abc.com">abc</a>
为此,请帮助配置nekohtml解析。
更新
我尝试使用设置
parser.setFeature(“http://cyberneko.org/html/features/balance-tags”,true);
没用。我没有按照我的预期给出结果。它返回与我给出的相同的html内容
答案 0 :(得分:0)
需要设置balance-tags
功能,指定NekoHTML解析器是否应尝试平衡已解析文档中的标记。
config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );
来自文档: