应用错误收集

使用正常的XSLT处理，Saxon将简单地使用像Xerces这样的XML解析器或Sun / Oracle JRE附带的Xerces版本，一旦解析器完成其工作并且Saxon在其树模型上运行，就无法知道是否原始输入具有像è这样的文字字符或像è这样的十进制字符引用或像è这样的十六进制字符。当序列化转换的结果树时，您当然可以使用字符映射将字符映射到您想要的任何表示，但结果树中的任何è都会感到高兴，而不仅仅是由十六进制字符产生的那些输入中的引用。如果要确保将所有非ASCII字符序列化为字符引用，则需要使用xsl:output encoding="US-ASCII"。 Saxon 9.1还提供http://saxonica.com/documentation9.1/extensions/output-extras/character-representation.html来控制格式。

但我同意所做的评论，现在将UTF-8作为输出编码，然后在结果树的序列化中只是文字字符不应该造成任何问题。

XML到HTML：字符实体编码

1 个答案: