我正在尝试为我写的一个小型回音服务器接受日语字符。问题是当我从System.in获取字符时(通过任何东西,扫描仪,InputStream
,你命名它)它们总是以垃圾的形式出现。我甚至尝试过使用
message = new String(bufferedReader.readLine().getBytes("UTF8");
为了尝试让字节以Unicode形式出现。
当我从服务器打印消息ようこそ(欢迎使用日语)时,它显示正常,只有在用户输入时才会出现此问题。
控制台设置为在eclipse中使用UTF8。
这是我编写的一个小测试程序,以确保它是System.in
的输入输入和输出
よ
よ
这是代码
public class TestUnicode {
public static void main(String[] args) throws IOException
{
BufferedReader stdIn = new BufferedReader(new InputStreamReader(System.in, "UTF8"));
String message = stdIn.readLine();
System.out.println(message);
}
}
public class Client {
public static void main(String[] args) throws IOException
{
Socket serverSocket = null;
try
{
serverSocket = new Socket("192.168.1.127", 3000); //connect to myself at port 3000
}
catch(IOException e)
{
System.out.println(e);
System.exit(1);
}
BufferedReader in = null;
PrintStream out = null;
try //create in and out to write and read from echo
{
in = new BufferedReader(new InputStreamReader(serverSocket.getInputStream()));
out = new PrintStream(serverSocket.getOutputStream(), true);
}
catch(IOException e)
{
serverSocket.close();
System.out.println(e);
System.exit(1);
}
String message = null;
message = in.readLine();
System.out.println(message); //print out the welcome message
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(System.in));
//create a new buffered reader from my input
try
{
while(true)
{
message = bufferedReader.readLine();
out.println(message); //send a line to the server
if(message.equals("quit"))
{
System.out.println(in.readLine());
break;
}
System.out.println(in.readLine()); //get it back and print it
}
System.out.println("Quiting client...");
}
catch(IOException e)
{
in.close();
out.close();
serverSocket.close();
System.out.println(e);
System.exit(1);
}
in.close();
out.close();
serverSocket.close();
}
}
答案 0 :(得分:1)
我认为您使用的是Windows
这里的问题是DOS提示使用与UTF-8完全不同的字符编码。如果是日语,那么它将是Shift-JIS,因此尝试用UTF-8 InputStream
读取它将不起作用。
幸运的是,有希望。您可以(并且应该)使用System.in
,而不是使用System.console()
。它将返回Console class的实例,其中包含有效的字符编码转换。但是,您必须意识到尝试从IDE(尤其是Eclipse)中调试它不会起作用,因为它不会附加Console。糟糕。
更正的代码(我肯定会工作,但我还没有测试过):
public class TestUnicode {
public static void main(String[] args) throws IOException
{
Console console = System.console();
String message = console.readLine();
console.writer().println(message);
}
请注意,您还需要使用Console
打印消息。为什么?这只是因为你需要双向转换字符编码。 DOS提示仍然保留在遗留编码中,并且无法改变它。
答案 1 :(得分:-1)
创建InputStreamReader时,应指定要使用的字符集:
new InputStreamReader(System.in, "UTF-8")
这也适用于您的套接字流。
如果不这样做,则将使用默认字符集(编码)。您还可以通过将-Dfile.encoding=UTF-8
添加为VM参数来更改默认值。
关于您的测试程序,System.out.println也使用默认的字符集,因此即使正确读取它也会弄乱您的字符串。因此,除非您更改默认字符集,否则可以使用类似的内容来打印字符串:
final OutputStreamWriter w = new OutputStreamWriter(System.out, "UTF-8");
w.write(message);
w.flush();
答案 2 :(得分:-1)
我用这种方式修改了你的课程
public class TestUnicode {
/**
* @param args
*/
public static void main(String[] args) {
BufferedReader stdIn = null;
try {
stdIn = new BufferedReader(new InputStreamReader(System.in, "UTF-8"));
} catch (UnsupportedEncodingException e1) {
e1.printStackTrace();
}
String message = "";
try {
message = stdIn.readLine();
} catch (IOException e) {
e.printStackTrace();
}
try {
System.out.println(new String(message.getBytes("UTF-8")));
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
}
并在控制台中运行并获得所需的输出。
所以在你的情况下,我建议你将字符编码部分放在BufferedReader和PrintStream中
注意:我尝试使用IDE运行它并输出'?'对于那个日文字符,我建议在控制台中运行它。