标签: language-agnostic character control-characters
我收集了一堆推文并将它们输出到命令行,这是我得到的:
这些推文有不同的语言,所以我怀疑我也有阿拉伯语。控制字符可以负责此输出吗?有几千行,以某种方式缩小为一行,据我所知,字符相互叠加。
发生了什么事?
答案 0 :(得分:0)
根据默认文本编码和系统的区域设置,您的数据将在打印到控制台时被解释。
我宁愿看看你收到的十六进制数据,即:0x4142430d0a ...而不是Unicode,UTF或你的系统正在使用的任何文本编码。
即使在http://en.wikipedia.org/wiki/Character_encoding