我在文件命令行功能中有一些行为。看来,即使据我所知,它也将空字节归类为数据文件,而我在网上可以找到的空字节也是UTF-8的一部分。下面是我的问题的一个例子。
printf "Hello\00, World!" > test.txt
file test.txt
Output: test.txt: data
为什么这不归类为UTF-8?
答案 0 :(得分:0)
由于0字节,它被归类为通用数据,这不是普通人类可读文本中显示的内容。而且,如果将其取出,因为它所有的都是可打印的ASCII字符,因此将被归类为该类,而不是UTF-8。