我收到一个带有标签的XML文件,其值为“97ò00430ò”,而此标签最初只包含数字。编码用途是“ISO-8859-1”。
如何检测java中的坏字符(²...)?
LNA
答案 0 :(得分:0)
我猜您可以使用正则表达式检查标签的格式(此处为" \ d +"如果您只想要数字)。
答案 1 :(得分:-2)
public static String encode(String chr) {
try {
byte[] bytes = chr.getBytes("ISO-8859-1");
if (!validUTF8(bytes))
return chr;
return new String(bytes, "UTF-8");
} catch (UnsupportedEncodingException e) {
throw new IllegalStateException("No char" + e.getMessage());
}
}