如何确保所有“喜欢”字符都可以在Java中标准化

时间:2019-01-24 17:30:40

标签: java normalize

我正在学习一些有关UTF-8字符及其构造的信息。

我正在研究一种方法,该方法将使用输入字符串并将任何“特殊”字符转换为它们的基本等效字符。

例如,我希望下面的“ c”值输出“ c”:

"ç" => "c"
"ć" => "c"
"č" => "c"
"ⓒ" => "c"
"" => "c"

但是,只有“ⓒ”被标准化为“ c”。

我正在使用这种方法:

private String getNormalizedInputText() {
    //String input = getIntent().getStringExtra(Intent.EXTRA_PROCESS_TEXT);
    String input = "ç ć č ⓒ ";

    String normalizedInput =  Normalizer.normalize(input, Normalizer.Form.NFKC);

    Log.d("Normalized Input", normalizedInput);

    return normalizedInput;
}

编辑:这可以通过数学方式完成吗?

0 个答案:

没有答案