尝试从正则表达式中的各个组获取数据失败

时间:2013-11-06 05:42:10

标签: java regex indexoutofboundsexception regex-group

我有以下正则表达式来查找字符串中的电子邮件(字符串中可能有0个或更多的电子邮件)。表达式有4个组,其中一些可以匹配空值:

RegexPlanet Test表达式:

          ([-A-Za-z0-9._!#$%^&*|{}'~`]+@[a-z0-9_-]+[\\.][a-z]{2,3}[\\.][a-z]{2,3})|([A-Za-z0-9.!#$%^&*|{}\"~`]+@[a-z0-9_-]+[\\.][a-z]{4})|([A-Z.a-z0-9!#$%^&*|{}'~`]+@[a-z0-9_-]+[\\.][a-z]{3})|([A-Za-z0-9.!#$%^&*_-|{}'~`]+@[a-z0-9_-]+[\\.][a-z]{2})

从匹配器读取数据的代码在ArrayOutOfBoundsException显示matchValue=matcher.group(i);

   ArrayList<String> result=new ArrayList<String>();
    Pattern pattern=Pattern.compile(regex);
    Matcher matcher=pattern.matcher(input);
    Log.d(TAG,"input: "+input);
    while(matcher.find())
    {
        String matchValue=null;
        for(int i=1;i<5;i++)
        {
            matchValue=matcher.group(i);
            if(matchValue!=null && !matchValue.equals(""))
            {    
                Log.d(TAG, "Group no: "+i+" Value: "+matchValue+" adding to result");
                result.add(matchValue);
            }
            else
            {
                Log.d(TAG, "Nothing matched for group i");
            }
        }    
    }
    return result;
}

代码是否有问题,或者这是否是其他的副作用?

提前感谢您提出宝贵意见

2 个答案:

答案 0 :(得分:2)

你知道什么输入导致异常吗? 通常,为避免此异常,您可以重写for循环:

for(int i=1;i<=matcher.groupCount();i++)
        {....}

答案 1 :(得分:1)

试试这个:

for(int i=1; i <= matcher.groupCount(); i++)
{
    matchValue=matcher.group(i);
    ...

我不确定为什么你的代码有问题,它似乎只有四个组,所以for(int i=1; i<5;似乎是正确的。但是让匹配器告诉你计数是什么更好。