我正在从用户那里收到一个包含无效元标记的HTML。之后,我试图通过tidy_repair_string函数进行解析。此时,功能将冻结,直到请求因超时而下降之前都不会抛出错误。我可以通过整理整洁的meta标签来解决它,但是也许tidy_repair_string
有一些参数可以避免这种情况?
在此文档中搜索:http://tidy.sourceforge.net/docs/quickref.html#MarkupHeader 但没有找到解决办法
//invalid html
$body = '<meta http-equiv="content-type" content="text/html" charset="utf-8">';
// valid html is:
// <meta http-equiv="content-type" content="text/html; charset=utf-8">'
$html = \tidy_repair_string(
$body, [
'wrap' => 0,
'fix-uri' => 0,
'newline' => 'LF',
'quote-ampersand' => false
], 'UTF8'
);