我有一天在测试我的PHP Tidy配置,发现它无法处理来自the guardian的任何页面。
我的配置是:
$tidy_config = array(
'new-blocklevel-tags' => 'article aside audio figure footer header nav section source track video svg',
'new-empty-tags' => 'source track',
'new-inline-tags' => 'audio canvas embed video',
'wrap' => 0,
'markup' => false,
);
$tidy->body()
输出一个空体,而我注意到$tidy->html()
输出不包含原始</head>
(存在于源中),而是将其移动到最后(就好像它是由Tidy自己添加的。)
我测试了Guardian首页和一些新闻/专栏页面,同样的问题。此配置适用于我的测试中的BBC或其他网站,至少我不希望它返回空body
或移动结束head
标记。
任何人都可以找出原因吗?
PS:我的Tidy发布版本是25 March 2009
,据我所知是最新版本。
答案 0 :(得分:0)
Sourceforge上的Tidy票证系统中有一项要求支持HTML5的功能请求。 Guardian页面使用的是HTML5。
另一方面,我会说Tidy不再被积极开发了。所有提交到CVS存储库的提交都已有数年之久,最近的提交在21个月之前就在实验目录中,改变了一些关于HTML5的内容。在Github还有一个分支,一年前最后一次提交。 https://github.com/w3c/tidy-html5你可以尝试编译它。