使用Univocity CSV解析器解析具有相同定义但列数不同的两个不同文件

时间:2016-08-19 14:17:44

标签: java csv parsing univocity

我正在使用Univocity解析器来解析CSV文件并将其填入Bean

我面临的问题是我有两个不同的文件。两个文件的结构相同,但它们的列数不同。它们都引用相同的Bean类。

例如:

File A contains(without header):
I|123|Hello
U|345|Hi

File B contains(without header):
123|Hello
345|Hi

Bean Class定义是:

public class Bean {
    @Trim
    @Parsed(index = 0)
    protected String action;

    @Trim
    @Parsed(index = 1)
    protected Long id;

    @Trim
    @Parsed(index = 2)
    protected String name;

    ......................
}

如果我对两个文件都使用相同的bean,那么两个文件中的列数都会相同,但是它会失败。

我认为我可以使用的另一种方法是为不同的文件集设置两个不同的bean,但我正在查看Univocity解析器中是否有任何功能来处理这种情况。

请帮忙。感谢。

1 个答案:

答案 0 :(得分:2)

您可以在解析每个输入之前“手动”设置标题。例如:

    CsvParserSettings s = new CsvParserSettings();
    s.setHeaderExtractionEnabled(false);
    CsvRoutines r = new CsvRoutines(s);

    //set headers of input with 3 columns
    s.setHeaders("action" , "id", "name");
    for(Bean b : r.iterate(Bean.class, new StringReader("I,123,Hello\nU,345,Hi"))){
        System.out.println(b);
    }

    //set headers of input with 2 columns
    s.setHeaders("id", "name");
    for(Bean b : r.iterate(Bean.class, new StringReader("123,Hello\n345,Hi"))){
        System.out.println(b);
    }

如果您将bean更改为使用标题名称而不是列位置,则上述操作将起作用:

public class Bean {
    @Trim
    @Parsed
    protected String action;

    @Trim
    @Parsed
    protected Long id;

    @Trim
    @Parsed
    protected String name;

我得到了以下输出(在toString()类中添加Bean方法后):

Bean{action='I', id=123, name='Hello'}
Bean{action='U', id=345, name='Hi'}
Bean{action='null', id=123, name='Hello'}
Bean{action='null', id=345, name='Hi'}

希望这有帮助!