在我的java web应用程序的* _fr.properties文件中,我看到法语字符被编码为这样(例如):
t\u00e9l\u00e9graphique entrant
这是什么类型的编码? (utf -8)?
此外,如果我有一个法语口音,我如何找到我的属性文件中的内容?
我正在查看的链接没有这种编码。
http://tlt.its.psu.edu/suggestions/international/bylanguage/french.html
答案 0 :(得分:1)
它是UTF-16,16位数字被写为四位十六进制转义符。对于您可能使用的所有字符,这些数字只是Unicode代码点。
如果你不得不处理来自“星界”之一的角色,其中代码点太大而不适合16位,那么事情稍微复杂一些,我们可以谈谈它。
这是Java本身在JVM中使用的编码 - 所有文本都表示为16位数字的序列 - 以及Java源代码中使用的格式。这就是它在属性文件中使用的原因。
要编写法语(或其他)字符,您需要找出它的代码点,并将其写为十六进制数。我可以推荐你到Unicode standard,但说实话,最简单的事情就是在Wikipedia上查看字符 - 他们的列表中的代码点已经用十六进制编写。举个例子,查看'00e9'就会发现那是'é'。