用于法语口音的Html编码

时间:2011-09-12 20:50:34

标签: java html

在我的java web应用程序的* _fr.properties文件中,我看到法语字符被编码为这样(例如):

t\u00e9l\u00e9graphique entrant

这是什么类型的编码? (utf -8)?
此外,如果我有一个法语口音,我如何找到我的属性文件中的内容? 我正在查看的链接没有这种编码。

http://tlt.its.psu.edu/suggestions/international/bylanguage/french.html

1 个答案:

答案 0 :(得分:1)

它是UTF-16,16位数字被写为四位十六进制转义符。对于您可能使用的所有字符,这些数字只是Unicode代码点。

如果你不得不处理来自“星界”之一的角色,其中代码点太大而不适合16位,那么事情稍微复杂一些,我们可以谈谈它。

这是Java本身在JVM中使用的编码 - 所有文本都表示为16位数字的序列 - 以及Java源代码中使用的格式。这就是它在属性文件中使用的原因。

要编写法语(或其他)字符,您需要找出它的代码点,并将其写为十六进制数。我可以推荐你到Unicode standard,但说实话,最简单的事情就是在Wikipedia上查看字符 - 他们的列表中的代码点已经用十六进制编写。举个例子,查看'00e9'就会发现那是'é'。