Question

我试图将txt文件分成字符串的ArrayList，到目前为止它可以工作，但文件中的第一个单词始终以（int）'65279'开头，我甚至无法复制此字符。此外，在GUI中，它似乎缺少第二个字母，但同时它在控制台中工作。其他的话也应该如此。我使用的是UTF-8格式的.txt文件。如何更改此IDE中的netBeans和GUI中的格式？

Answer 1

U + FEFF是byte order mark。它用于表示字符编码/字节序（例如，您可以很容易地区分大端和小端UTF-16）。

如果它导致您出现问题，最简单的方法就是剥离它：

if (text.startsWith("\ufeff")) {
    text = text.substring(1);
}

Java意外字符解析txt文件

1 个答案: