我想删除文本中的任何html标记,以便逐句翻译。
我尝试使用preg_match返回不同句子的数组但没有成功。 运气不错。
是否可以将标签存储在某处以便稍后在代码中重新插入?文本翻译后?
现在我有:
public function translate($text) {
$bool = preg_match('/(<[^>]+)/i', $text, $strings_to_translate); //untested
// Ruan Regex /(<p(>|\s+[^>]*>).*?<\/p>)/i
//Ideally strip dupes from this before looping
var_dump($strings_to_translate);
foreach($strings_to_translate as $to_translate) {
echo $to_translate;
}
return TRUE;
}
由于
答案 0 :(得分:1)
您只需使用split("\n", strip_tags($text))
逐行获取数据数组(或将"\n"
替换为"."
即可获得句子。