如何在Java中处理csv数据中的逗号

时间:2013-04-12 19:45:05

标签: java csv java.util.scanner

我正在使用scanner.delimiter拆分我的csv,分隔符为“,”。但是我有一些数据包括数据中的逗号,如“Monsters,Inc。”

但是,如果我将分隔符设置为“\”,\“”,那么它就会崩溃。

不要求我编写自己的scanner.delimiter方法的想法?

1 个答案:

答案 0 :(得分:2)

我不认为scanner.delimiter会解决这类问题。 如果你在数据中有引号,你可以使用正则表达式或代码来解决这类问题,也可以使用类似的答案/问题中提到的String.split。 如果你没有报价,那么你真的无能为力。

stackoverflow上有类似的例子。 例如,我认为这适用于您:

Splitting a csv file with quotes as text-delimiter using String.split()

使用拆分

public static void main(String[] args) {
    String s = "Sachin,,M,\"Maths,Science,English\",Need to improve in these subjects.";
    String[] splitted = s.split(",(?=([^\"]*\"[^\"]*\")*[^\"]*$)");
    System.out.println(Arrays.toString(splitted));
}

使用自定义代码

public static ArrayList<String> customSplitSpecific(String s)
{
    ArrayList<String> words = new ArrayList<String>();
    boolean notInsideComma = true;
    int start =0, end=0;
    for(int i=0; i<s.length()-1; i++)
    {
        if(s.charAt(i)==',' && notInsideComma)
        {
            words.add(s.substring(start,i));
            start = i+1;                
        }   
        else if(s.charAt(i)=='"')
        notInsideComma=!notInsideComma;
    }
    words.add(s.substring(start));
    return words;
}