我有一个非常简单的tsv文件,条目如下:
614 2006-07-13 15:30:05 2009-11-20 23:56:21 510 350 3265 10 34
1038 2006-07-15 16:12:15 2009-11-16 05:12:11 304 443 4405 7 156
1437 2006-07-16 12:29:24 2009-11-16 16:25:12 45 73 725 6 37
2615 2006-07-19 23:23:55 2009-11-27 18:34:36 211 230 211 7 0
3148 2006-07-26 14:17:22 2009-11-20 17:35:18 7346 7244 11438 8 97
5593 2006-09-08 10:58:49 2009-11-24 06:08:27 898 1024 2897 8 56
它没有标题,我从其他来源获取它,所以我无法控制它的编写方式。我想在第一栏中阅读,用它做点什么,而忽略其余部分。
我的代码是:
List<Long> userIds = new ArrayList<Long>();
ICsvMapReader mapReader = null;
try {
mapReader = new CsvMapReader(new FileReader(inFile), CsvPreference.TAB_PREFERENCE);
// only map the first column - setting header elements to null means those columns are ignored
final String[] header = new String[] { "userid", null, null, null, null, null, null };
final CellProcessor[] processors = new CellProcessor[] {null,
null,
null,
null,
null,
null,
null };
Map<String, Object> userMap;
while( (userMap = mapReader.read(header, processors)) != null ) {
Long userId = Long.parseLong(userMap.get("userid").toString());
userIds.add(userId);
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
finally {
IOUtils.closeQuietly(mapReader);
}
我没有异常,但mapReader.read()行总是返回null。我尝试在处理器的第一个位置使用新的ParseLong()代替null,这没有任何效果。我觉得我错过了一些非常基本的东西。
答案 0 :(得分:0)
你的代码对我来说很好,虽然我不得不在标题和处理器中添加额外的null
元素,因为数据中实际上有8列。否则,Super CSV会抛出异常:
org.supercsv.exception.SuperCsvException: The number of columns
to be processed (8) must match the number of CellProcessors (7):
check that the number of CellProcessors you have defined matches
the expected number of columns being read/written
context={lineNo=1, rowNo=1, columnNo=1, rowSource=
[614, 2006-07-13 15:30:05, 2009-11-20 23:56:21, 510, 350, 3265, 10, 34]}
我会检查你是否正在阅读正确的文件 - 听起来你正在阅读一个空文件......
答案 1 :(得分:0)
使用uniVocity-parsers解析您的TSV文件:
TsvParserSettings parserSettings = new TsvParserSettings();
parserSettings.selectIndexes(0); //selects the first column only
TsvParser parser = new TsvParser(parserSettings);
//the rows will contain a String array of length 1, with the values of the first column only.
List<String[]> parsedRows = parser.readAll(new FileReader(yourFile));
另外,请勿使用CSV解析器来解析TSV文件。解析算法不等同(即使它最初看起来那样)。
披露:我是这个图书馆的作者。它是开源和免费的(Apache V2.0许可证)。