regex_replace替换某些html标签

时间:2011-05-10 19:12:55

标签: perl content-management-system movabletype

有没有办法将BR标签和/或DIV标签转换为新行,以便在我使用mailto时正确格式化?我在想我应该寻找任何P,DIV和BR标签,并用新的线字符替换它们。因此,在任何有结束标记的位置放置新行字符并删除开始标记。在我执行上述操作后,我将使用remove_html =“1”删除其余的html,但我想保留段落格式。

我认为可以使用regex_replace完成,但我不确定如何编写它。有人知道吗?

1 个答案:

答案 0 :(得分:0)

不要使用正则表达式解析HTML文件,使用HTML解析器(HTML :: TreeBuilder或可以在行更改中执行的类似操作)模块,或者在这种情况下,甚至更好地使用XSLT转换。