我正在进行一项任务,我需要对给定文本的每个字符的位进行异或。例如,怪异的字母就像'��'。
当试图保存时,Eclipse提示"某些字符无法用Cp1252 ..."映射,之后我可以选择保存为UTF-8。
我对字符编码的了解非常模糊;不会保存到UTF-8改变位?如果是这样,我怎么可以使用原始消息(原始位)来对它们进行异或并完成我的任务?
谢谢!
答案 0 :(得分:0)
我假设你在这个答案中使用Java。
文件编码仅更改数据在文件中的表示方式。当您再次读取文件(使用正确的编码)时,它将在您的String中转换回Unicode,因此程序将看到相同的位。
与Unicode 7中的113,021个字符相比,编码Cp1252只能表示少量字符(小于256)。所有这些字符都可以用UTF-8编码。