从文件java中读取西里尔字母和非西里尔字符

时间:2013-09-13 21:27:20

标签: java string utf-8 cyrillic

我有一个包含西里尔字母和非西里尔字符的文件。但是,当我读取文件时,不会恢复西里尔字符,并且会重新获取非西里尔字符。这是我正在使用的代码

private static String dirToPRocess = "D:\\stopwords_freq_v2.txt";

BufferedReader br = null;
    try {
        br = new BufferedReader(new InputStreamReader(new FileInputStream(
                dirToPRocess), "UTF-8"));
                    String line = br.readLine();
            while (line != null) {
                                System.out.println(line);
                                line = br.readLine();
                                              }
        } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
         }
             try {
        br.close();
         } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

1 个答案:

答案 0 :(得分:0)

你在使用eclipse吗?

您可以尝试以下方法让它发挥作用:

使用字符编码utf-8保存您的java文件。

如果您想将西里尔字母打印到控制台,我认为eclipse的属性可能会在某个地方设置,但不是100%肯定 - 根据我的经验,它应默认打印西里尔字母。

你的java代码看起来很好btw。