从System.in Java中获取日语或中文输入

时间:2013-09-16 04:25:35

标签: java input internationalization stream

我正在尝试为我写的一个小型回音服务器接受日语字符。问题是当我从System.in获取字符时(通过任何东西,扫描仪,InputStream,你命名它)它们总是以垃圾的形式出现。我甚至尝试过使用

message = new String(bufferedReader.readLine().getBytes("UTF8");  

为了尝试让字节以Unicode形式出现。

当我从服务器打印消息ようこそ(欢迎使用日语)时,它显示正常,只有在用户输入时才会出现此问题。

控制台设置为在eclipse中使用UTF8。

这是我编写的一个小测试程序,以确保它是System.in

的输入

输入和输出

よ
よ

这是代码

public class TestUnicode {

public static void main(String[] args) throws IOException
{
    BufferedReader stdIn = new BufferedReader(new InputStreamReader(System.in, "UTF8"));
    String message = stdIn.readLine();
    System.out.println(message);
}

}

public class Client {

public static void main(String[] args) throws IOException 
{
    Socket serverSocket = null;

    try
    {
        serverSocket = new Socket("192.168.1.127", 3000); //connect to myself at port 3000
    }
    catch(IOException e)
    {
        System.out.println(e);
        System.exit(1);
    }

    BufferedReader in = null;
    PrintStream out = null;     
    try //create in and out to write and read from echo
    {
        in = new BufferedReader(new InputStreamReader(serverSocket.getInputStream()));
        out = new PrintStream(serverSocket.getOutputStream(), true);
    }
    catch(IOException e)
    {
        serverSocket.close();
        System.out.println(e);
        System.exit(1);
    }

    String message = null;
    message = in.readLine();
    System.out.println(message); //print out the welcome message

    BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(System.in));
    //create a new buffered reader from my input

    try
    {
        while(true)
        {
            message = bufferedReader.readLine();
            out.println(message); //send a line to the server
            if(message.equals("quit"))
            {
                System.out.println(in.readLine());
                break;
            }
            System.out.println(in.readLine()); //get it back and print it               
        }

        System.out.println("Quiting client...");
    }
    catch(IOException e)
    {
        in.close();
        out.close();
        serverSocket.close();
        System.out.println(e);
        System.exit(1);
    }

    in.close();
    out.close();
    serverSocket.close();
}
}

3 个答案:

答案 0 :(得分:1)

我认为您使用的是Windows 这里的问题是DOS提示使用与UTF-8完全不同的字符编码。如果是日语,那么它将是Shift-JIS,因此尝试用UTF-8 InputStream读取它将不起作用。

幸运的是,有希望。您可以(并且应该)使用System.in,而不是使用System.console()。它将返回Console class的实例,其中包含有效的字符编码转换。但是,您必须意识到尝试从IDE(尤其是Eclipse)中调试它不会起作用,因为它不会附加Console。糟糕。

更正的代码(我肯定会工作,但我还没有测试过):

public class TestUnicode {

public static void main(String[] args) throws IOException
{
Console console = System.console();
String message = console.readLine();
console.writer().println(message);
}

请注意,您还需要使用Console打印消息。为什么?这只是因为你需要双向转换字符编码。 DOS提示仍然保留在遗留编码中,并且无法改变它。

答案 1 :(得分:-1)

创建InputStreamReader时,应指定要使用的字符集:

new InputStreamReader(System.in, "UTF-8")

这也适用于您的套接字流。

如果不这样做,则将使用默认字符集(编码)。您还可以通过将-Dfile.encoding=UTF-8添加为VM参数来更改默认值。

关于您的测试程序,System.out.println也使用默认的字符集,因此即使正确读取它也会弄乱您的字符串。因此,除非您更改默认字符集,否则可以使用类似的内容来打印字符串:

final OutputStreamWriter w = new OutputStreamWriter(System.out, "UTF-8");
w.write(message);
w.flush();

答案 2 :(得分:-1)

我用这种方式修改了你的课程

public class TestUnicode {

    /**
     * @param args
     */
    public static void main(String[] args) {
        BufferedReader stdIn = null;
        try {
            stdIn = new BufferedReader(new InputStreamReader(System.in, "UTF-8"));
        } catch (UnsupportedEncodingException e1) {
            e1.printStackTrace();
        }
        String message = "";
        try {
            message = stdIn.readLine();
        } catch (IOException e) {
            e.printStackTrace();
        }
        try {
            System.out.println(new String(message.getBytes("UTF-8")));
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
    }
}

并在控制台中运行并获得所需的输出。

所以在你的情况下,我建议你将字符编码部分放在BufferedReader和PrintStream中

注意:我尝试使用IDE运行它并输出'?'对于那个日文字符,我建议在控制台中运行它。

enter image description here