我试图将txt文件分成字符串的ArrayList,到目前为止它可以工作,但文件中的第一个单词始终以(int)'65279'开头,我甚至无法复制此字符。此外,在GUI中,它似乎缺少第二个字母,但同时它在控制台中工作。其他的话也应该如此。我使用的是UTF-8格式的.txt文件。如何更改此IDE中的netBeans和GUI中的格式?
答案 0 :(得分:2)
U + FEFF是byte order mark。它用于表示字符编码/字节序(例如,您可以很容易地区分大端和小端UTF-16)。
如果它导致您出现问题,最简单的方法就是剥离它:
if (text.startsWith("\ufeff")) {
text = text.substring(1);
}