希望这不是一个愚蠢的问题
因此,当用XML表示UTF-8编码的非ASCII字符时,我知道我们可以使用小数或十六进制表示
'&安培;#' [0-9] +';' (十进制)
'&安培;#x的' [0-9a-fA-F] +&#39 ;;' (十六进制)
要采用以下表情符号示例,我们可以
十进制HTML实体=&符号+#128578;
十六进制HTML实体=&符号+#x1f642; (十六进制代码点)
然而,此表情符号的UTF-8 HEX值的另一种表示形式是 F0 9F 99 82
那么,如果我们将F0 9F 99 82放入XML中,它是否就像那样或者它是否有前缀,如果是这样的话?
你什么时候使用&符+#x1f642; vs F0 9F 99 82?
答案 0 :(得分:0)
如果您编写以UTF-8编码的文档,则原始UTF-8编码的字节可以在文件中。请注意编码声明:
<?xml version='1.0' encoding='utf-8'?>
<test></test>
如果您没有使用UTF-8编码,HTML实体可以提供相同的结果:
<?xml version='1.0' encoding='ascii'?>
<test>🙂🙂</test>