有没有办法替换任何外国字符,例如:ã,ä到a,Ĉ,ć到c等。 我的意思是留下像a-Z这样的简单字母,没有任何额外的东西。
答案 0 :(得分:3)
如果您可以使用正则表达式,则可以执行此正则表达式:
str = str.replaceAll("[^a-zA-Z]", ""); //Assuming it to be a Java String
但是,如果您希望将文字规范化,则应该按照此问题的接受答案建议:Remove diacritical marks (ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ) from Unicode chars
如果您需要在PHP中实现相同的功能,可以写:
echo iconv('UTF-8', 'US-ASCII//TRANSLIT', 'asdaśćż,ąółwe,ÄĄ;ú');