在XML内容中保留HTML标记SAX Parser Python

时间:2013-08-07 14:36:08

标签: python xml parsing

我正在使用python的xml.sax库来解析XML内容。我有HTML标签带有我的XML文件的一些标签。让我们说:例如:

<Car>
<Color> Blue</Color>
<Size> 1500 </Size>
<Description><p>This is <b>new  in the market</b></p></Description>
</Car>

所以我目前得到的是

Color :   Blue  
Size  :   1500
Description : <
Description : p
Description : >
Description : This is 
Description : <
Description : b
Description : >
Description : new in the market
.... and so on.

我想要的是它返回:

Description - <p>This is <b>new in the market</p>

该文件非常大,所以我无法在CDATA中手动拥有HTML标记 而且我需要显示文件中的所有内容,有没有办法克服这个?

1 个答案:

答案 0 :(得分:0)

保留您在进入“描述”节点时设置的状态变量,并关闭该状态变量以按您希望的方式处理内部标记。离开时清除状态。