如何删除所有html标签?我们可以单独保存吗?

时间:2013-08-01 15:57:40

标签: php regex tags html-parsing preg-match

我想删除文本中的任何html标记,以便逐句翻译。

我尝试使用preg_match返回不同句子的数组但没有成功。 运气不错。

是否可以将标签存储在某处以便稍后在代码中重新插入?文本翻译后?

现在我有:

public function translate($text) {

    $bool = preg_match('/(<[^>]+)/i', $text, $strings_to_translate); //untested
    // Ruan Regex /(<p(>|\s+[^>]*>).*?<\/p>)/i
    //Ideally strip dupes from this before looping

    var_dump($strings_to_translate);

    foreach($strings_to_translate as $to_translate) {

        echo $to_translate;
    }
    return TRUE;
}

由于

1 个答案:

答案 0 :(得分:1)

您只需使用split("\n", strip_tags($text))逐行获取数据数组(或将"\n"替换为"."即可获得句子。