读取Java中的CSV文件并将值存储在int数组中

时间:2013-01-01 21:24:07

标签: java csv

我有一个这种格式的字符串CSV文件:

14/10/2011  422     391.6592    394.52324   0.039215686
13/10/2011  408.43  391.7612    395.0686031 0.039215686
12/10/2011  402.19  391.834     395.3478736 0.039215686

我想要做的就是在csv文件中读取,然后将第3和第4个coloumns数据存储在整数数组中。

这是我写的代码:

    BufferedReader CSVFile = 
            new BufferedReader(new FileReader("appleData.csv"));

    String dataRow = CSVFile.readLine(); 
    int count = 0;

    while (dataRow != null){
        String[] dataArray = dataRow.split(",");

        EMA[count] = dataArray[2];
        SMA[count] = dataArray[3];

        dataRow = CSVFile.readLine(); // Read next line of data.
    }
    // Close the file once all data has been read.
    CSVFile.close();

我想最终得到两个数组,EMA包含第3个coloumn和SMA中包含第4个coloumn值的所有值。

我收到空指针异常。有人可以告诉我我犯了什么错误吗?

3 个答案:

答案 0 :(得分:4)

您的文件似乎使用空格/制表符作为分隔符,但您可以使用逗号分割。这对我来说毫无意义。

您假设数据行有一定的长度而不检查它。这对我来说毫无意义。

此代码将向您展示如何更好地完成此任务:

package cruft;

import org.apache.commons.lang3.StringUtils;

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.io.Reader;
import java.util.LinkedHashMap;
import java.util.LinkedList;
import java.util.List;
import java.util.Map;

/**
 * CsvParser
 * @author Michael
 * @link http://stackoverflow.com/questions/14114358/reading-csv-file-in-java-and-storing-the-values-in-an-int-array/14114365#14114365
 * @since 1/1/13 4:26 PM
 */
public class CsvParser {
    public static void main(String[] args) {
        try {
            FileReader fr = new FileReader((args.length > 0) ? args[0] : "resources/test.csv");
            Map<String, List<String>> values = parseCsv(fr, "\\s+", true);
            System.out.println(values);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

    public static Map<String, List<String>> parseCsv(Reader reader, String separator, boolean hasHeader) throws IOException {
        Map<String, List<String>> values = new LinkedHashMap<String, List<String>>();
        List<String> columnNames = new LinkedList<String>();
        BufferedReader br = null;
        br = new BufferedReader(reader);
        String line;
        int numLines = 0;
        while ((line = br.readLine()) != null) {
            if (StringUtils.isNotBlank(line)) {
                if (!line.startsWith("#")) {
                    String[] tokens = line.split(separator);
                    if (tokens != null) {
                        for (int i = 0; i < tokens.length; ++i) {
                            if (numLines == 0) {
                                columnNames.add(hasHeader ? tokens[i] : ("row_"+i));
                            } else {
                                List<String> column = values.get(columnNames.get(i));
                                if (column == null) {
                                    column = new LinkedList<String>();
                                }
                                column.add(tokens[i]);
                                values.put(columnNames.get(i), column);
                            }
                        }
                    }
                    ++numLines;
                }
            }
        }
        return values;
    }
}

这是我用来测试它的输入文件:

# This shows that comments, headers and blank lines work fine, too.
date        value1  value2      value3      value4
14/10/2011  422     391.6592    394.52324   0.039215686

13/10/2011  408.43  391.7612    395.0686031 0.039215686



12/10/2011  402.19  391.834     395.3478736 0.039215686

这是我得到的输出:

{date=[14/10/2011, 13/10/2011, 12/10/2011], value1=[422, 408.43, 402.19], value2=[391.6592, 391.7612, 391.834], value3=[394.52324, 395.0686031, 395.3478736], value4=[0.039215686, 0.039215686, 0.039215686]}

Process finished with exit code 0

答案 1 :(得分:0)

[1] while循环中应该有一个count ++

[2]您尚未定义/初始化数组EMA和SMA - 导致异常。

[3]如果你用逗号分割()并有一个空格分隔的文件,结果将是一个单位长度的数组,索引2和3生成NullPointerException - 即使你正确地初始化数组。

我建议通过在循环中将它们添加到List(如ArrayList或Vector)来读取数字,因为您事先并不知道大小。一旦你离开循环,创建2个适当大小的数组和copyInto()数组中的数据。让垃圾收集器处理向量。

答案 2 :(得分:0)

您的代码的问题是int [] EMA不是初始化。它只是定义了EMA是一个整数数组,没有有效地创建它(你只有引用)。

我的建议是将EMA和SMA更改为ArrayLists,而不是使用属性,您可以将当前元素添加到列表中。

在循环结束时,您可以使用size()方法获取每个ArrayList上的元素数,并可以使用toArray方法将它们更改为数组,从而实现您可能拥有的任何目标。

当然,我假设你忘记了你的例子中的逗号。否则,您应该将分隔符更改为空格。