我正在使用简单的html dom解析器来修复html标记中的错误,例如缺少引号,例如
<div class=foo></div>
我的代码:
$els = $doc->find("div[class]");
foreach($els as $el)
{
$class = $el->getAttribute("class");
$el->setAttribute("class", "\"".$class."\"");
}
它有效,但缺点是它不适用于已经有引号的元素,例如。 <div class="foo"></div>
会导致<div class='"foo"'></div>
,这对我来说似乎是一个错误。
我也无法检查是否引用了类,因为解析器只返回没有引号的字符串,而且我也不想使用outertext,因为可能还有其他属性需要考虑。
任何想法如何解决这个问题?
感谢