嗨我有错误的HTML,我想用jsoup清理它。有些标签有两个样式属性。但是jsoup只保存了最后一个。
例如
<body style="color:red" style="font-size:10">
是否可以连接它们?
答案 0 :(得分:0)
这是不可能的,因为Jsoup的解析器只考虑一次。你必须做这样的事情:
Document doc = Jsoup.parse(html);
String firstAttr = doc.select("body").attr("style");
doc = Jsoup.parse(html.replaceFirst("style=\"" + firstAttr + "\"", ""));
String secondAttr = doc.select("body").attr("style");