如何比较文本文件的每一行? java的

时间:2015-07-12 17:50:29

标签: java text compare lines lowercase

我有一个包含内容的文本文件,包含792行:

der 17788648
und 14355959
die 10939606
Die 10480597

现在我想比较一下" Die"和"死"小写相等。 因此,如果lowerCase中的两个字符串相等,则将该单词复制到lowerCase中的新文本文件中并将值相加。

预期产出:

der 17788648
und 14355959
die 114420203

我到目前为止:

    try {
        BufferedReader bk = null;
        BufferedWriter bw = null;

        bk = new BufferedReader(new FileReader("outagain.txt"));
        bw = new BufferedWriter(new FileWriter("outagain5.txt"));

        List<String> list = new ArrayList<>();
        String s = "";
        while (s != null) {
            s = bk.readLine();
            list.add(s);
        }


        for (int k = 0; k < 793; k++) {
            String u = bk.readLine();
            if (list.contains(u.toLowerCase())) {

                //sum values?

            } else {
                bw.write(u + "\n");
            }
        }

        System.out.println(list.size());

    } catch (Exception e) {
        System.out.println("Exception caught : " + e);
    }

5 个答案:

答案 0 :(得分:1)

而不是list.add(s);,请使用list.add(s.toLowerCase());。现在你的代码正在将不确定情况的行与较低情况的行进行比较。

答案 1 :(得分:1)

使用Java 8,读取文件,比较,分组和收集等标准问题的最佳方法是使用流API,因为以这种方式做到这一点要简单得多。至少当文件只有几KB时,就没有问题了。 类似的东西:

Map<String, Integer> nameSumMap = Files.lines(Paths.get("test.txt"))
            .map(x -> x.split(" "))
            .collect(Collectors.groupingBy(x -> x[0].toLowerCase(),
                    Collectors.summingInt(x -> Integer.parseInt(x[1]))
            ));

首先,您可以使用Files.lines()读取文件,该文件返回Stream<String>,而不是将字符串拆分为Stream<String[]>, 最后,您可以使用groupingBy()summingInt()函数按数组的第一个元素进行分组,并将第二个元素求和。

如果您不想使用流API,您还可以创建HashMap并在循环中手动进行求和。

答案 2 :(得分:0)

String类有一个equalIgnoreCase方法,您可以使用它来比较两个字符串,无论大小写如何。所以:

String var1 = "Die";
String var2 = "die";

System.out.println(var1.equalsIgnoreCase(var2));

将打印为TRUE。

答案 3 :(得分:0)

如果我的问题是正确的,你想知道如何从文件中获取前缀,比较它,获取它背后的值并为每个前缀求它们。那是对的吗?

您可以使用正则表达式单独获取前缀和值。然后,您可以使用相同的前缀汇总所有值,并将它们写入每个文件的文件中。

如果您不熟悉正则表达式,此链接可以帮助您:

Regex on tutorialpoint.com

Regex on vogella.com

对于其他教程,只需扫描谷歌&#34; java正则表达式&#34;或类似的标签。

如果你不想区分大小写字符串,只需将它们全部转换为低位/高位,然后再将它们比作@spork已解释过。

答案 4 :(得分:0)

使用HashMap跟踪唯一字段。在你做一个看跌期权之前,先看看价值是否已存在。如果是,则将旧值与新值相加并再次将其放入(这将替换具有相同键的旧行)

package com.foundations.framework.concurrency;

import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.HashMap;
import java.util.Iterator;

public class FileSummarizer {

  public static void main(String[] args) {
    HashMap<String, Long> rows = new HashMap<String, Long>();
    String line = "";
    BufferedReader reader = null;
    try {
      reader = new BufferedReader(new FileReader("data.txt"));
      while ((line = reader.readLine()) != null) {
        String[] tokens = line.split(" ");
        String key = tokens[0].toLowerCase();
        Long current = Long.parseLong(tokens[1]);

        Long previous = rows.get(key);
        if(previous != null){
          current += previous;
        }
        rows.put(key, current);
      }
    }
    catch (IOException e) {
      e.printStackTrace();
    }
    finally {
      try {
        reader.close();
        Iterator<String> iterator = rows.keySet().iterator();
        while (iterator.hasNext()) {
          String key = iterator.next().toString();
          String value = rows.get(key).toString();

          System.out.println(key + " " + value);
        }
      }
      catch (IOException e) {
        e.printStackTrace();
      }
    }
  }
}