什么是文本文件中“行尾”的UTF-8表示

时间:2012-12-12 09:12:58

标签: java utf-8

UTF-8中“行尾”的二进制表示形式是什么。

3 个答案:

答案 0 :(得分:32)

a bunch

  • LF:换行,U+000A(十六进制UTF-8:0A)
  • VT:垂直制表符,U+000B(十六进制UTF-8:0B)
  • FF:换页,U+000C(十六进制UTF-8:0C)
  • CR:回车,U+000D(十六进制UTF-8:0D)
  • CR+LF:CR(U+000D)后跟LF(U+000A)(十六进制UTF-8:0D0A)
  • NEL:下一行U+0085(十六进制UTF-8:C285)
  • LS:行分隔符,U+2028(十六进制UTF-8:E280A8)
  • PS:段落分隔符U+2029(十六进制UTF-8:E280A9)

......可能还有更多。

最常用的是LF(* nix),CR+LF(Windows和DOS)和CR(旧的OSX前Mac系统)。

答案 1 :(得分:18)

在UTF-8(十六进制)中,它的> 0x0A(0a)
UTF-8(二进制) - > 00001010

enter image description here

答案 2 :(得分:5)

UTF-8与ASCII兼容,因此UTF-8也使用换行的ASCII代码10(0x0A)和回车的13代码(0x0D)。