我目前正致力于翻译大数据集(约7000行)。此数据集包含英语短语以及HTML标记,已使用Google翻译翻译为荷兰语。
但是,在审核生成的翻译时,Google翻译还会通过添加空格来对HTML标记进行加密。我想删除已翻译文件中HTML标记内的所有无效空格。例如:
this is a test. < a href = "hello.php" >test</ a>;
应该成为:
this is a test. <a href="hello.php">test</a>;
是否有可以使这成为可能的正则表达式?
答案 0 :(得分:1)
$text = str_replace("< ", "<", $text);
$text = str_replace("> ", ">", $text);
$text = str_replace(" <", "<", $text);
$text = str_replace(" >", ">", $text);
$text = str_replace("= ", "=", $text);
$text = str_replace(" =", "=", $text);
$text = str_replace("\/ ", "\/", $text);