我有一个相当大的XSLT模板,其中包含双语文本(UTF-8中的国家字符)。我正在寻找一个函数,该函数将重新编码内部的所有CDATA
元素以使用XML #
实体,从而允许将XSLT存储为纯US-ASCII
编码。
这是一个基本示例:
<?xml version="1.0" encoding="UTF-8"?>
<test>Soirée</test>
其中é
被编码为C3 A9
。所需的输出将是
<?xml version="1.0" encoding="US-ASCII"?>
<test>Soirée</test>
其中é
对应于'LATIN SMALL LETTER E WITH ACUTE' (U+00E9)
的代码点。在第一个示例上更改编码前导会导致错误,因为UTF-8字节变为无效。
是否有一种简单的方法可以执行此操作?还是必须诉诸宏?