如何避免在解析CSV行中的空位置时触发ArrayIndexOutOfBoundsException?

时间:2011-07-05 11:28:47

标签: java exception-handling csv string-parsing indexoutofboundsexception

String[] values = line.split(",");

Long locId = Long.parseLong(replaceQuotes(values[0]));
String country = replaceQuotes(values[1]);
String region = replaceQuotes(values[2]);
String city = replaceQuotes(values[3]);
String postalCode = replaceQuotes(values[4]);
String latitude = replaceQuotes(values[5]);
String longitude = replaceQuotes(values[6]);
String metroCode = replaceQuotes(values[7]);
String areaCode = replaceQuotes(values[8]);

//...

public String replaceQuotes(String txt){
    txt = txt.replaceAll("\"", "");
    return txt;
}

我正在使用上面的代码用这种格式的数据解析CSV:

828,"US","IL","Melrose Park","60160",41.9050,-87.8641,602,708

然而,当我遇到以下数据时,我得到 java.lang.ArrayIndexOutOfBoundsException: 7

1,"O1","","","",0.0000,0.0000,,

这是否意味着每当我尝试访问values[7]的值时,都会抛出异常?

如果是这样,我如何解析文本行的那个位置不包含数据的行?

2 个答案:

答案 0 :(得分:6)

首先,String.split()不是一个很好的CSV解析器:它不知道引号,只要你的一个引用值包含逗号就会搞砸。

话虽如此,默认情况下String.split()会遗漏空的尾随元素。您可以使用the two-argument variant

来影响它
String[] values = line.split(",", -1);
  • -1(或任何负值)表示数组将尽可能大。
  • 使用正值可以完成最大分割量(意味着除此之外的所有内容都是单个值,即使它包含逗号)。
  • 0(默认情况下,如果使用单参数值)意味着数组将尽可能大,空尾随值将被排除在数组之外(正如你遇到的那样)。

答案 1 :(得分:1)

作为一般规则,如果已经存在一个有效的解析器,你永远不应该破解你自己的(错误的)解析器。 CSV不容易正确解析,并且String.split不会执行此任务,因为CSV允许在,之间使用"而不作为单独的人使用。

考虑使用OpenCSV。这将解决您现在遇到的问题以及当用户使用,作为数据的一部分时您将面临的问题。