PHP Tidy错误地删除了结束标记

时间:2013-10-30 07:20:13

标签: php tidy

我有一天在测试我的PHP Tidy配置,发现它无法处理来自the guardian的任何页面。

我的配置是:

$tidy_config = array(
    'new-blocklevel-tags' => 'article aside audio figure footer header nav section source track video svg',
    'new-empty-tags' => 'source track',
    'new-inline-tags' => 'audio canvas embed video',
    'wrap' => 0,
    'markup' => false,
);

$tidy->body()输出一个空体,而我注意到$tidy->html()输出不包含原始</head>(存在于源中),而是将其移动到最后(就好像它是由Tidy自己添加的。)

我测试了Guardian首页和一些新闻/专栏页面,同样的问题。此配置适用于我的测试中的BBC或其他网站,至少我不希望它返回空body或移动结束head标记。

任何人都可以找出原因吗?

PS:我的Tidy发布版本是25 March 2009,据我所知是最新版本

1 个答案:

答案 0 :(得分:0)

Sourceforge上的Tidy票证系统中有一项要求支持HTML5的功能请求。 Guardian页面使用的是HTML5。

另一方面,我会说Tidy不再被积极开发了。所有提交到CVS存储库的提交都已有数年之久,最近的提交在21个月之前就在实验目录中,改变了一些关于HTML5的内容。在Github还有一个分支,一年前最后一次提交。 https://github.com/w3c/tidy-html5你可以尝试编译它。