java Normalizer在不同的机器上表现不同

时间:2012-12-02 15:55:01

标签: java string multilingual

这段代码在开发工作中运行良好,但在生产方面却没有。

import java.text.Normalizer;
public class TestNorm {
        public static void main(String args[]) {
                String s = "";

                for (String s1: args) {
                        s = s + " " + s1;
                }

                System.out.println(Normalizer.normalize(s.toLowerCase(), Normalizer.Form.NFD).replaceAll("[^\\p{ASCII}]", "").replaceAll("[^\\p{Alnum}]+", "-").replaceAll("^[^a-z0-9]+", "").replaceAll("[^a-z0-9]+$", ""));
        }
}

(空白)

DevEnv$ java TestNorm hellö 
> hello

(空白)

ProdEnv$ java TestNorm hellö
> hell

我错过了什么?为什么我没有获得相同的Normalizer结果; “你好” 吗

可能是一个有用的信息来了解

DevEnv$ java -version
java version "1.6.0_37"
Java(TM) SE Runtime Environment (build 1.6.0_37-b06-434-11M3909)
Java HotSpot(TM) 64-Bit Server VM (build 20.12-b01-434, mixed mode)

(空白)

ProdEnv$ java -version
java version "1.7.0_01"
Java(TM) SE Runtime Environment (build 1.7.0_01-b08)
Java HotSpot(TM) Client VM (build 21.1-b02, mixed mode, sharing)

1 个答案:

答案 0 :(得分:0)

好的,我为所有遇到同样问题的人找到了解决方案!

我查看了这个网站; http://perlgeek.de/en/article/set-up-a-clean-utf8-environment

执行了这个;

export LC_ALL=en_US.UTF-8
export LANG=en_US.UTF-8
export LANGUAGE=en_US.UTF-8

并使用此

进行测试
perl -Mcharnames=:full -CS -wle 'print "\N{EURO SIGN}"'

输出应为“€”

我上面写的代码也会起作用......