可移动类型:如何删除所有HTML等

时间:2010-11-09 00:08:44

标签: regex movabletype

<mt:EntryBody>中,我在条目中嵌入了几张图片和标题 我想删除所有用于在rss中发布的html。

这是我的条目格式:

<img src="/path/to/img.jpg">
<div style="text-align:right">Image Caption</div>
<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse</p>

如果我这样做:

<mt:EntryBody remove_html="1">

这会删除所有带有EntryBody的HTML元素,但我还想取出Image Caption部分因为它看起来很奇怪而没有引用图像。

我如何做到这一点?

2 个答案:

答案 0 :(得分:2)

如果您使用MT 4/5 Pro,最简单的方法是在自定义字段中显示图像和标题,然后您可以选择性地将它们输出到相应的模板中。如果它在内容中那么类似的东西将非常困难,即使正如Abe Miessler指出的正则表达式那样。

答案 1 :(得分:0)

普遍的智慧说you should not use regex to parse HTML。你能将它转换为XHTML,然后使用xslt / xpath来做你想做的事吗?

如果可以,请查看: