Android Regex模式编码UTF-8

时间:2015-11-16 20:47:40

标签: javascript android json regex encoding

我在android中尝试使用matcher.group(1)捕获(。+?)中的代码:

String html = doc.html().toString();

Pattern p = Pattern.compile("(?is)caption\":\"(.+?)\",", Pattern.DOTALL);
Matcher m = p.matcher(html);
if (m.find()){
     text_main = m.group(1);
}

它有效,但不适用于所有角色。当(。+?)包含除英语以外的任何语言的波斯语字符或字符时,它不起作用。我认为模式只支持UTF-16。

那么我能为UTF-8字符做些什么呢?我可以用这种方式捕获UTF-8字符吗?如果我不能,那么我该怎么做呢?

主要是我试图从json对象中获取一个字符串。 json代码放在​​html页面的脚本中。

0 个答案:

没有答案