我有一些html,其中包含一些特殊的html字符,例如
...但是将此字符整齐为�
作为空格。
// tidy config
$tidyConfig = array(
'indent' => true,
'output-xhtml' => true,
'input-encoding' => 'utf8',
'output-encoding' => 'utf8',
'show-body-only' => true,
'fix-backslash' => true,
'quote-marks' => true,
'wrap' => 1024,
);
// tidy up
$string = (string)tidy_parse_string($string, $tidyConfig);
必须设置或更改选项。
答案 0 :(得分:1)
这个怎么样? http://codepad.viper-7.com/B5PDFc
bare Top Type:Boolean默认值:no示例:y / n,yes / no,t / f, 是/否,1/0 此选项指定Tidy是否应剥离Microsoft 来自Word 2000文档的特定HTML,以及输出空格而不是 输入中存在的不间断空格。
$string = 'word word word';
// tidy config
$tidyConfig = array(
'indent' => true,
'output-xhtml' => false,
'input-encoding' => 'utf8',
'output-encoding' => 'utf8',
'show-body-only' =>true,
'fix-backslash' => true,
'quote-marks' => true,
'wrap' => 1024,
'bare' => true,
);
// tidy up
var_dump((string)tidy_parse_string($string, $tidyConfig));
* output-xhtml(false)是我试验过的,但它对输出没有影响(在这种情况下)