xml:日语编码

时间:2011-10-16 20:55:19

标签: xml unicode encoding character-encoding

我正在制作一个包含日文字符串的xml文档。我尝试了不同的编码,但每当我保存文件时,它用“??????”取代日语字符串..我这里有一个非常简短的示例代码..请告诉我应该使用什么编码xml doc。

<?xml version="1.0" encoding="utf-8"?>
<config>
        <start_text>転送</start_text>
</config>

请告诉我应该使用哪种编码,以便即使在保存和关闭xml文档后也可以保留日文字符。 谢谢大家

1 个答案:

答案 0 :(得分:2)

XML文件中有两个日文字符,您会得到六个问号。这有点像UTF-8编码,如XML文件中所述。有几种可能性:

读取XML文件的程序使用编码ASCII读取它,因此用问号替换ASCII范围之外的每个字节。

程序正确读取XML文件,然后使用ASCII编码将UTF-8编码的字节打印到某个输出通道,用问号替换每个超出范围的字节。

(旁注:如果输出为転é??,则将UTF-8打印到ISO-8859-1输出通道。但它似乎是六个问号。)

您需要找出以下转换发生在哪些地方:

  • 字节序列转换为字符序列。 (可能在XML阅读器中。)
  • 将字符序列转换为字节序列。
  • 将字节(或字符)序列转换为字形序列。 (用于显示它们;这可能是编辑器或控制台。)