来自java中的csv文件的电子邮件验证

时间:2014-09-12 18:05:09

标签: java email csv indexoutofboundsexception opencsv

所以我有这个包含一堆字段的CSV文件,其中一个是电子邮件字段。某些已输入的电子邮件为空,其他电子邮件格式不正确。有点像这样:

Entry|First Name|Last Name|Email|Sign-up Date
1|Mike|Smith|mike.smith@gmail.com|2004-08-08
2||||2006-06-12
3|Perry|File|public|2010-09-14

我在这里检测电子邮件有效的代码是这样的:

private boolean[] validEmail;

public void setValidEmail(File fileName){
    Log log = LogFactory.getLog(LoadValidEmail.class);
    try{
        CSVReader csvReader = new CSVReader(new FileReader(fileName.getPath()));
        String[] row = null;
        char[] email = null;
        int count = 0;
        while(!(row = csvReader.readNext()).equals(null)){
            if(count!=0){
                if(!row[3].isEmpty()){
                    email = row[3].toCharArray();
                    for(int i = 0; i < email.length; i++){
                        if(email[i] == '@'){
                            validEmail[count-1]=true;
                            break;
                        }
                    }
                    if(!validEmail[count-1]){
                        validEmail[count-1] = false;
                    }
                }else{
                    validEmail[count-1] = false;
                }
            }
            count++;
        }
    }catch(FileNotFoundException e){
        log.info("File could not be found, make sure directory is correct and try again");
        e.printStackTrace();
    }catch(IOException e){
        log.info("File could not read next line, make sure file contains information and try again");
        e.printStackTrace();
    }catch(IndexOutOfBoundsException e){
        log.info("The array has gone out of bounds, this is not the row you are looking for");
        e.printStackTrace();
    }
}

每次运行时都会抛出一个IndexOutOfBoundsException并在该行崩溃:

if(!row[3].isEmpty()){
    ...
}

我真的不知道为什么它会抛出这个错误,因为我正在尝试访问电子邮件字段,这是CSV文件的第四个字段。为什么抛出这个异常以及如何修复它而不自动抛出它?

1 个答案:

答案 0 :(得分:1)

首先,您需要告诉CSVReader默认情况下您的分隔符为|,需要new CSVReader(new FileReader(fileName.getPath()), '|');

此外,我认为没有任何理由将validEmail作为数组,我认为它应该只是boolean

还有一个建议是使用正则表达式验证电子邮件,而不是通过char和验证来读取它。