所以看完这段视频后我很困惑:https://www.youtube.com/watch?v=MijmeoH9LT4
所以我知道要从ASCII转换为Unicode,您只需将0放在前面,所以ASCII中的1000001将是... 0000000000001000001。但是反过来呢?视频中的那个人说“ 110xxxxx”表示由于前面有两个1,因此还有2个字节要传入。但这就是我困惑的开始。因为“ 110xxxxx”本身与ASCII中的特定字符匹配,系统会不会仅识别为一个特定的ASCII字符,而不是识别为“此后再输入两个字节”?
edit:有人建议了链接,而我阅读了所有链接,但没有一个解释。1.为什么unicode无法保存在硬盘中,而ASCII既可以是二进制值(0s和1s),也可以保存2。 “编码”实际上是做什么的。这些链接上的帖子说他们没有转化。那...怎么办? Unicode的阿拉伯字符不会通过UTF-8转换为任何东西,它们只会将它们存储为UTF-8格式...但是使用UTF-8的计算机甚至无法识别Unicode中的阿拉伯字符(因为这台计算机只能识别ASCII),那么到底有什么意义呢?