删除HTML标记内的空格

时间:2012-05-08 12:24:02

标签: php html preg-replace

我目前正致力于翻译大数据集(约7000行)。此数据集包含英语短语以及HTML标记,已使用Google翻译翻译为荷兰语。

但是,在审核生成的翻译时,Google翻译还会通过添加空格来对HTML标记进行加密。我想删除已翻译文件中HTML标记内的所有无效空格。例如:

this is a test. < a href = "hello.php" >test</ a>;

应该成为:

this is a test. <a href="hello.php">test</a>;

是否有可以使这成为可能的正则表达式?

1 个答案:

答案 0 :(得分:1)

$text = str_replace("< ", "<", $text);
$text = str_replace("> ", ">", $text);
$text = str_replace(" <", "<", $text);
$text = str_replace(" >", ">", $text);
$text = str_replace("= ", "=", $text);
$text = str_replace(" =", "=", $text);
$text = str_replace("\/ ", "\/", $text);