我想拆分一个 CSV文件,它使用java在其数据中包含逗号和其他特殊字符。我尝试了像line.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)", -1);
那样的正则分词方法和更类似的东西。但是在某些行中拆分是错误的。
CSV大约有3000行。其中一些没有正确分裂。 请建议一种在csv文件中拆分数据的标准方法。
答案 0 :(得分:1)
如果您有标准桌面或网络应用Apache-CSV或OpenCSV可能会对您有所帮助。如果你正在处理某种"大数据"技术可以查看Spark。
答案 1 :(得分:0)
您可以使用tab(\ t)来代替使用逗号分隔值。 文件可以使用.csv扩展名保存。它对我有用。
答案 2 :(得分:0)
将所有特殊字符替换为+
然后拆分
String result = str.replaceAll("[^\\dA-Za-z ]", "").replaceAll("\\s+", "+");