CsvMapReader似乎没有解析我的文件

时间:2014-05-21 21:52:36

标签: java tsv supercsv

我有一个非常简单的tsv文件,条目如下:

614 2006-07-13 15:30:05 2009-11-20 23:56:21 510 350 3265    10  34
1038    2006-07-15 16:12:15 2009-11-16 05:12:11 304 443 4405    7   156
1437    2006-07-16 12:29:24 2009-11-16 16:25:12 45  73  725 6   37
2615    2006-07-19 23:23:55 2009-11-27 18:34:36 211 230 211 7   0
3148    2006-07-26 14:17:22 2009-11-20 17:35:18 7346    7244    11438   8   97
5593    2006-09-08 10:58:49 2009-11-24 06:08:27 898 1024    2897    8   56

它没有标题,我从其他来源获取它,所以我无法控制它的编写方式。我想在第一栏中阅读,用它做点什么,而忽略其余部分。

我的代码是:

    List<Long> userIds = new ArrayList<Long>();

    ICsvMapReader mapReader =  null;
    try {
        mapReader = new CsvMapReader(new FileReader(inFile), CsvPreference.TAB_PREFERENCE);  

        // only map the first column - setting header elements to null means those columns are ignored
        final String[] header = new String[] { "userid", null, null, null, null, null, null };

        final CellProcessor[] processors = new CellProcessor[] {null,
                null,
                null,
                null,
                null,
                null,
                null };

        Map<String, Object> userMap;
        while( (userMap = mapReader.read(header, processors)) != null ) {
            Long userId = Long.parseLong(userMap.get("userid").toString());
            userIds.add(userId);
        }

    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    finally {
        IOUtils.closeQuietly(mapReader);
    }

我没有异常,但mapReader.read()行总是返回null。我尝试在处理器的第一个位置使用新的ParseLong()代替null,这没有任何效果。我觉得我错过了一些非常基本的东西。

2 个答案:

答案 0 :(得分:0)

你的代码对我来说很好,虽然我不得不在标题和处理器中添加额外的null元素,因为数据中实际上有8列。否则,Super CSV会抛出异常:

org.supercsv.exception.SuperCsvException: The number of columns 
to be processed (8) must match the number of CellProcessors (7): 
check that the number of CellProcessors you have defined matches 
the expected number of columns being read/written
context={lineNo=1, rowNo=1, columnNo=1, rowSource=
[614, 2006-07-13 15:30:05, 2009-11-20 23:56:21, 510, 350, 3265, 10, 34]}

我会检查你是否正在阅读正确的文件 - 听起来你正在阅读一个空文件......

答案 1 :(得分:0)

使用uniVocity-parsers解析您的TSV文件:

TsvParserSettings parserSettings = new TsvParserSettings();
parserSettings.selectIndexes(0); //selects the first column only
TsvParser parser = new TsvParser(parserSettings);

//the rows will contain a String array of length 1, with the values of the first column only.
List<String[]> parsedRows = parser.readAll(new FileReader(yourFile));

另外,请勿使用CSV解析器来解析TSV文件。解析算法不等同(即使它最初看起来那样)。

披露:我是这个图书馆的作者。它是开源和免费的(Apache V2.0许可证)。