使用python使用unicode在XML上进行Diff

时间:2011-04-11 20:57:58

标签: python xml unicode diff difflib

我正在尝试创建一个可以直观显示两个XML之间差异的Web工具。 difflib在创建具有差异的html方面做得非常好,但随后在XML中显示了一些unicode文本,结果html现在包含html编码的字母。

有没有其他方法解决这个问题?

1 个答案:

答案 0 :(得分:1)

我认为困扰你的是'html 字符实体',而不是它们的数字对应物。你可以重新映射它们,例如通过您最喜欢的cli工具支持正则表达式(例如sed)和来自unicode e-workersreference的表格。数字实体编码可以在html和xml文件中使用。

最好的问候,carsten