我有一个这种格式的字符串CSV文件:
14/10/2011 422 391.6592 394.52324 0.039215686
13/10/2011 408.43 391.7612 395.0686031 0.039215686
12/10/2011 402.19 391.834 395.3478736 0.039215686
我想要做的就是在csv文件中读取,然后将第3和第4个coloumns数据存储在整数数组中。
这是我写的代码:
BufferedReader CSVFile =
new BufferedReader(new FileReader("appleData.csv"));
String dataRow = CSVFile.readLine();
int count = 0;
while (dataRow != null){
String[] dataArray = dataRow.split(",");
EMA[count] = dataArray[2];
SMA[count] = dataArray[3];
dataRow = CSVFile.readLine(); // Read next line of data.
}
// Close the file once all data has been read.
CSVFile.close();
我想最终得到两个数组,EMA包含第3个coloumn和SMA中包含第4个coloumn值的所有值。
我收到空指针异常。有人可以告诉我我犯了什么错误吗?
答案 0 :(得分:4)
您的文件似乎使用空格/制表符作为分隔符,但您可以使用逗号分割。这对我来说毫无意义。
您假设数据行有一定的长度而不检查它。这对我来说毫无意义。
此代码将向您展示如何更好地完成此任务:
package cruft;
import org.apache.commons.lang3.StringUtils;
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.io.Reader;
import java.util.LinkedHashMap;
import java.util.LinkedList;
import java.util.List;
import java.util.Map;
/**
* CsvParser
* @author Michael
* @link http://stackoverflow.com/questions/14114358/reading-csv-file-in-java-and-storing-the-values-in-an-int-array/14114365#14114365
* @since 1/1/13 4:26 PM
*/
public class CsvParser {
public static void main(String[] args) {
try {
FileReader fr = new FileReader((args.length > 0) ? args[0] : "resources/test.csv");
Map<String, List<String>> values = parseCsv(fr, "\\s+", true);
System.out.println(values);
} catch (IOException e) {
e.printStackTrace();
}
}
public static Map<String, List<String>> parseCsv(Reader reader, String separator, boolean hasHeader) throws IOException {
Map<String, List<String>> values = new LinkedHashMap<String, List<String>>();
List<String> columnNames = new LinkedList<String>();
BufferedReader br = null;
br = new BufferedReader(reader);
String line;
int numLines = 0;
while ((line = br.readLine()) != null) {
if (StringUtils.isNotBlank(line)) {
if (!line.startsWith("#")) {
String[] tokens = line.split(separator);
if (tokens != null) {
for (int i = 0; i < tokens.length; ++i) {
if (numLines == 0) {
columnNames.add(hasHeader ? tokens[i] : ("row_"+i));
} else {
List<String> column = values.get(columnNames.get(i));
if (column == null) {
column = new LinkedList<String>();
}
column.add(tokens[i]);
values.put(columnNames.get(i), column);
}
}
}
++numLines;
}
}
}
return values;
}
}
这是我用来测试它的输入文件:
# This shows that comments, headers and blank lines work fine, too.
date value1 value2 value3 value4
14/10/2011 422 391.6592 394.52324 0.039215686
13/10/2011 408.43 391.7612 395.0686031 0.039215686
12/10/2011 402.19 391.834 395.3478736 0.039215686
这是我得到的输出:
{date=[14/10/2011, 13/10/2011, 12/10/2011], value1=[422, 408.43, 402.19], value2=[391.6592, 391.7612, 391.834], value3=[394.52324, 395.0686031, 395.3478736], value4=[0.039215686, 0.039215686, 0.039215686]}
Process finished with exit code 0
答案 1 :(得分:0)
[1] while循环中应该有一个count ++
[2]您尚未定义/初始化数组EMA和SMA - 导致异常。
[3]如果你用逗号分割()并有一个空格分隔的文件,结果将是一个单位长度的数组,索引2和3生成NullPointerException - 即使你正确地初始化数组。
我建议通过在循环中将它们添加到List(如ArrayList或Vector)来读取数字,因为您事先并不知道大小。一旦你离开循环,创建2个适当大小的数组和copyInto()数组中的数据。让垃圾收集器处理向量。
答案 2 :(得分:0)
您的代码的问题是int [] EMA不是初始化。它只是定义了EMA是一个整数数组,没有有效地创建它(你只有引用)。
我的建议是将EMA和SMA更改为ArrayLists,而不是使用属性,您可以将当前元素添加到列表中。
在循环结束时,您可以使用size()方法获取每个ArrayList上的元素数,并可以使用toArray方法将它们更改为数组,从而实现您可能拥有的任何目标。
当然,我假设你忘记了你的例子中的逗号。否则,您应该将分隔符更改为空格。