UTF-8:无法识别的字符

时间:2014-02-15 15:47:31

标签: java parsing utf-8 hashmap

我正在尝试使用HashMap解析文本文件。问题是我有像Ş和special这样的特殊字符,我的应用程序无法识别它们。 这是我的代码:

    Map<String, String> m = new LinkedHashMap<String, String>();
    FileInputStream fin = null;
    InputStreamReader isr = null;
    BufferedReader br = null;
    try {
      fin = new FileInputStream("inferredflexforms.txt");
      isr = new InputStreamReader(fin, "UTF-8");
      br = new BufferedReader(isr);
      String line = br.readLine();
      while (line != null) {

        String[] toks = line.split("\\s+");
        m.put(toks[0], toks[1]);
        line = br.readLine();
      }
    } finally {
      if (br != null)  { br.close();  }
      if (isr != null) { isr.close(); }
      if (fin != null) { fin.close(); }
    }

System.out.println(m);

我的文本文件包含:dănţaseşidansa

我的输出是:dăn?ase?i = dansa

“ş”和“ţ”被“?”取代。 我该怎么办? 谢谢。

0 个答案:

没有答案