我正在学习一些有关UTF-8字符及其构造的信息。
我正在研究一种方法,该方法将使用输入字符串并将任何“特殊”字符转换为它们的基本等效字符。
例如,我希望下面的“ c”值输出“ c”:
"ç" => "c"
"ć" => "c"
"č" => "c"
"ⓒ" => "c"
"" => "c"
但是,只有“ⓒ”被标准化为“ c”。
我正在使用这种方法:
private String getNormalizedInputText() {
//String input = getIntent().getStringExtra(Intent.EXTRA_PROCESS_TEXT);
String input = "ç ć č ⓒ ";
String normalizedInput = Normalizer.normalize(input, Normalizer.Form.NFKC);
Log.d("Normalized Input", normalizedInput);
return normalizedInput;
}
编辑:这可以通过数学方式完成吗?