Java :(文件)扫描仪的第一个"下一个"添加一个未知的符号

时间:2014-09-06 17:03:45

标签: java file utf-8

我正在使用Scanner来扫描文件以查找Java中的特定数据。

它获得的第一个结果(作为文本文件中的第一个单词)应该类似于test,但是,它会返回此单词,前面带有 unknown 字符。字。 (就此而言,我指的是如果角色未知,或者字体不支持,则出现的正方形,如:☐)。 我正在使用的文本文件以UTF-8编码。

情况就是这样:

Scanner scanner = new Scanner(new File("data/File.txt"));
[...]
scanner.next();
scanner.close();

因此,它返回的是☐test,其中应该有test。当然,原始文本文件的特征是test没有这种奇怪的标志。

感谢您的帮助!

1 个答案:

答案 0 :(得分:0)

您将这个奇怪的角色作为控制台的输出,因为控制台未编码为UTF-8。

Run Configuration - >更改控制台Common显示UTF-8内容

enter image description here