Question

我想删除文本中的任何html标记，以便逐句翻译。

我尝试使用preg_match返回不同句子的数组但没有成功。运气不错。

是否可以将标签存储在某处以便稍后在代码中重新插入？文本翻译后？

现在我有：

public function translate($text) {

    $bool = preg_match('/(<[^>]+)/i', $text, $strings_to_translate); //untested
    // Ruan Regex /(<p(>|\s+[^>]*>).*?<\/p>)/i
    //Ideally strip dupes from this before looping

    var_dump($strings_to_translate);

    foreach($strings_to_translate as $to_translate) {

        echo $to_translate;
    }
    return TRUE;
}

由于

Answer 1

您只需使用split("\n", strip_tags($text))逐行获取数据数组（或将"\n"替换为"."即可获得句子。

如何删除所有html标签？我们可以单独保存吗？

1 个答案: