我在android中尝试使用matcher.group(1)捕获(。+?)中的代码:
String html = doc.html().toString();
Pattern p = Pattern.compile("(?is)caption\":\"(.+?)\",", Pattern.DOTALL);
Matcher m = p.matcher(html);
if (m.find()){
text_main = m.group(1);
}
它有效,但不适用于所有角色。当(。+?)包含除英语以外的任何语言的波斯语字符或字符时,它不起作用。我认为模式只支持UTF-16。
那么我能为UTF-8字符做些什么呢?我可以用这种方式捕获UTF-8字符吗?如果我不能,那么我该怎么做呢?
主要是我试图从json对象中获取一个字符串。 json代码放在html页面的脚本中。