PHP的正则表达式引擎,用于删除所有html标记,替换为占位符,然后将其重新添加

时间:2012-01-31 20:49:21

标签: php regex

我正在使用内容API,它需要剥离HTML并且只保留文本,但我想重新插入html标记,以便在远程API更改后将html恢复到内容正文。

有没有人知道一个优雅的解决方案来实现这一点?

哈德森

2 个答案:

答案 0 :(得分:0)

最简单的解决方案是存储数据的剥离副本(可能通过建议的strip_tags),也可以存储原始副本。

您离开的任何占位符都可能会破坏您的非HTML代码,从而更容易维护两份副本。

答案 1 :(得分:0)

正则表达式是你的朋友。这里有一个很好的例子:http://www.regular-expressions.info/examples.html。

使用preg_replace删除html标记并替换为您自己的占位符(如||||)。保存匹配代码以返回代码并遍历字符串以查找下一个||||使用str_replace并使用array_shift关闭顶部数组元素。