String.split() - 如何区分制表符分隔值和逗号分隔值?

时间:2016-08-12 12:10:25

标签: java string csv split

我正在使用Java从文件中收集列数据类型。某些文件是制表符分隔的,有些是逗号分隔的。带有以下代码:

String[] valuesFromColumns = null;
                   if (line.split("\\s*\\t\\s*") != null) {

                    System.out.println("Separating by tab: " + line);
                            valuesFromColumns = line.split("\\s*\\t\\s*");

                    } else if(line.split("\\s*,\\s*")!=null) {
                    System.out.println("Separating by comma." + line);
                            valuesFromColumns = line.split("\\s*,\\s*");
                    } 

                    for(String s : valuesFromColumns) {
                        this.extractDataTypeFromTheLine(s);
                 }

输出不是预期的结果:它错误地将逗号分隔的文件用于制表符分隔值。我可能做错了什么? 这是输出:

/Users/macbook/open_data_us/GPL94-tbl-1.txt
Separating by tab: 67023_at AI342132        Homo sapiens    Mar 11, 2009    Consensus sequence  GenBank Cluster Incl. AI342132:qt26c08.x1 Homo sapiens cDNA, 3' end /clone=IMAGE-1949102 /clone_end=3' /gb=AI342132 /gi=4079059 /ug=Hs.156499 /len=414  AI342132                            
String
String
String
...
/Users/macbook/open_data_us/Performance Metrics - Transportation.csv
Separating by tab: Alley Pot Hole,06/06/2011,Week,10,1.65,3,06/06/2011 - 06/12/2011
String
/Users/macbook/open_data_us/redditSubmissions.csv
Separating by tab: 0,1333178161,2012-03-31T14:16:01.093638-07:00,Expectation,35,rmun4,29,GifSound,6,1333203361,23,3,Gangsta_Raper
String

1 个答案:

答案 0 :(得分:1)

当正则表达式找不到任何匹配项时,

line.split不返回null。相反,它返回一个数组,整行作为第一个也是唯一的元素。

因此,第一个条件始终是真的。