使用Apache Commons CSV从CSV文件中跳过空记录

时间:2016-04-19 09:49:32

标签: java csv

如果CSV文件包含三列,且值如下所示

a,b,c
     //empty line
,,,
a,b,c

有两个有效记录。使用Apache commons CSV解析器,我可以轻松跳过具有空行的记录。但是当记录只包含空值时,如何跳过它呢?

为了解决这个问题,我使用String equals()已经构建了空记录。这是一个示例实现。

List<String[]> csvContentsList = new ArrayList<String[]>();
CSVFormat csvFormat = CSVFormat.DEFAULT.withNullString("");
CSVParser csvParser = new CSVParser(fileReader, csvFormat);

String[] nullRecordArray = { null, null, null};
String nullRecordString = Arrays.toString(nullRecordArray);
for (CSVRecord csvRecord : csvParser) {
    try {
        String values[] = { csvRecord.get(0),csvRecord.get(1),csvRecord.get(2) };
        if (!nullRecordString.equals(Arrays.toString(values))) //lineA
            csvContentsList.add(values);
    } catch (Exception e) {
        // exception handling
    }
}

当我不使用标记为&#39; lineA&#39;的行时,此实现会在csvContentsList中提供三条记录,如下所示

[a,b,c]
[null,null,null]
[a,b,c]

有没有内置的方法来做到这一点?或任何其他更好的方式?

2 个答案:

答案 0 :(得分:1)

你可以这样尝试StringUtils#isNotBlank()

if (StringUtils.isNotBlank(csvRecord.get(0)) 
     && StringUtils.isNotBlank(csvRecord.get(1)) 
     && StringUtils.isNotBlank(csvRecord.get(2))) {        
   csvContentsList.add(values); 
}

答案 1 :(得分:1)

在这里找到另一种可能的解决方案。

CSVFormat csvFormat = CSVFormat.DEFAULT.withNullString("");
CSVParser csvParser = new CSVParser(fileReader, csvFormat);
for (CSVRecord csvRecord : csvParser.getRecords()) {
    String values[] = {csvRecord.get(0), csvRecord.get(1), csvRecord.get(2)};
    for (String value : values) {
        if (value != null) {
            // as soon a value is not-null we add the array
            // and exit the for-loop
            csvContentsList.add(values);
            break;
        }
    }
}

支持输入

a,b,c

,,,
d,e,f

<强>输出

a,b,c
d,e,f

编辑如果您可以使用Java 8解决方案。

List<String[]> csvContentsList = csvParser.getRecords()
        .stream() 
        .sequential() // 1.
        .map((csvRecord) -> new String[]{
            csvRecord.get(0), 
            csvRecord.get(1), 
            csvRecord.get(2)
        }) // 2.
        .filter(v -> Arrays.stream(v)
                .filter(t -> t != null)
                .findFirst()
                .isPresent()
        ) // 3.
        .collect(Collectors.toList()); // 4.
  1. 如果行的顺序很重要
  2. 将csvRecord映射到String []
  3. 对具有至少一个非空值的字符串数组进行过滤
  4. 收集所有值并返回列表
  5. 可能需要根据您的要求进行修改。