检查字符串是否包含编码错误的字符

时间:2016-09-28 12:44:48

标签: java jackson

我收到一个带有标签的XML文件,其值为“97ò00430ò”,而此标签最初只包含数字。编码用途是“ISO-8859-1”。

如何检测java中的坏字符(²...)?

LNA

2 个答案:

答案 0 :(得分:0)

我猜您可以使用正则表达式检查标签的格式(此处为" \ d +"如果您只想要数字)。

答案 1 :(得分:-2)

public static String encode(String chr) {
  try {
   byte[] bytes = chr.getBytes("ISO-8859-1");
   if (!validUTF8(bytes))
    return chr;   
   return new String(bytes, "UTF-8"); 
  } catch (UnsupportedEncodingException e) {

   throw new IllegalStateException("No char" + e.getMessage());
  }

 }