Java意外字符解析txt文件

时间:2015-06-19 07:40:26

标签: java utf-8

我试图将txt文件分成字符串的ArrayList,到目前为止它可以工作,但文件中的第一个单词始终以(int)'65279'开头,我甚至无法复制此字符。此外,在GUI中,它似乎缺少第二个字母,但同时它在控制台中工作。其他的话也应该如此。我使用的是UTF-8格式的.txt文件。如何更改此IDE中的netBeans和GUI中的格式?

1 个答案:

答案 0 :(得分:2)

U + FEFF是byte order mark。它用于表示字符编码/字节序(例如,您可以很容易地区分大端和小端UTF-16)。

如果它导致您出现问题,最简单的方法就是剥离它:

if (text.startsWith("\ufeff")) {
    text = text.substring(1);
}