我有一个CSV文件,其中包含以下字段: 字段1,字段2,字段3,频率,我想将其分配给Java中的哈希映射变量。 here下面的代码是扫描文件并计算每行的频率,但是我已经有了频率的文件所以我只需要阅读几行。所以我替换
// split the transaction into items
带
String[] lineSplited = line.split(" ");
String itemString = lineSplited[0];
Integer count = Integer.valueOf(lineSplited[1]);
mapSupport.put(itemString, count);
在原始代码中
private void DetermineFrequencyOfSingleItems(String input,
final Map<String, Integer> mapSupport)
throws FileNotFoundException, IOException {
//Create object for reading the input file
BufferedReader reader = new BufferedReader(new FileReader(input));
String line;
// for each line (transaction) until the end of file
while( ((line = reader.readLine())!= null)){
// if the line is a comment, is empty or is a
// kind of metadata
if (line.isEmpty() == true ||
line.charAt(0) == '#' || line.charAt(0) == '%'
|| line.charAt(0) == '@') {
continue;
}
// split the transaction into items
String[] lineSplited = line.split(" ");
// for each item in the transaction
for(String itemString : lineSplited){
// increase the support count of the item
Integer count = mapSupport.get(itemString);
if(count == null){
mapSupport.put(itemString, 1);
}else{
mapSupport.put(itemString, ++count);
}
}
// increase the transaction count
transactionCount++;
}
// close the input file
reader.close();
}
但它没有用,有什么建议吗?
答案 0 :(得分:0)
在原始程序中,行频率被计算,因此使用“”(空格)分割CSV行没有区别。
但是,由于您正在读取数据,因此在使用地图中的键或解析为整数之前,必须使用“,”(逗号)和修剪字符串进行拆分。
请具体说明您的问题以及您遇到的错误。
由于您的文件是标签间距,并且您希望将最后一个字段作为计数并将其作为键值,请尝试
String frequency = line.substring(line.lastIndexOf('\t')+1);// Parse as Integer
String key=line.substring(0, line.lastIndexOf('\t'));
mapSupport.put(key,Integer.parseInt(frequency));