将CSV文件读入hashmap

时间:2017-11-10 12:04:52

标签: java csv hashmap frequency

我有一个CSV文件,其中包含以下字段: 字段1,字段2,字段3,频率,我想将其分配给Java中的哈希映射变量。 here下面的代码是扫描文件并计算每行的频率,但是我已经有了频率的文件所以我只需要阅读几行。所以我替换

    // split the transaction into items

        String[] lineSplited = line.split(" "); 
        String itemString = lineSplited[0];
        Integer count = Integer.valueOf(lineSplited[1]);
        mapSupport.put(itemString, count);

在原始代码中

private void DetermineFrequencyOfSingleItems(String input,
            final Map<String, Integer> mapSupport)
            throws FileNotFoundException, IOException {
        //Create object for reading the input file
        BufferedReader reader = new BufferedReader(new FileReader(input));
        String line;
        // for each line (transaction) until the end of file
        while( ((line = reader.readLine())!= null)){ 
            // if the line is  a comment, is  empty or is a
            // kind of metadata
            if (line.isEmpty() == true ||
                    line.charAt(0) == '#' || line.charAt(0) == '%'
                            || line.charAt(0) == '@') {
                continue;
            }

            // split the transaction into items
            String[] lineSplited = line.split(" ");
             // for each item in the transaction
            for(String itemString : lineSplited){ 
                // increase the support count of the item
                Integer count = mapSupport.get(itemString);
                if(count == null){
                    mapSupport.put(itemString, 1);
                }else{
                    mapSupport.put(itemString, ++count);
                }
            }
            // increase the transaction count
            transactionCount++;
        }
        // close the input file
        reader.close();
    } 

但它没有用,有什么建议吗?

1 个答案:

答案 0 :(得分:0)

在原始程序中,行频率被计算,因此使用“”(空格)分割CSV行没有区别。

但是,由于您正在读取数据,因此在使用地图中的键或解析为整数之前,必须使用“,”(逗号)和修剪字符串进行拆分。

请具体说明您的问题以及您遇到的错误。

由于您的文件是标签间距,并且您希望将最后一个字段作为计数并将其作为键值,请尝试

String frequency = line.substring(line.lastIndexOf('\t')+1);// Parse as Integer 
String key=line.substring(0, line.lastIndexOf('\t'));
mapSupport.put(key,Integer.parseInt(frequency));