Tab / LF / CR unicode字符

时间:2010-03-15 04:59:13

标签: ruby unicode iconv

我有一个Unicode文件(UTF-16 FFFE little-endian BOM),其中包含以制表符分隔的字段行。

阅读Splitting unicode (I think) using .split in ruby,我将使用Ruby分割(文件到行,然后行到字段)。

BTW,什么是Unicode字符:

  • LF
  • CR
  • 标签

谢谢!

2 个答案:

答案 0 :(得分:7)

答案 1 :(得分:4)

Unicode TAB为u0009。 LF为u000a,CR为u000d

实际上与ASCII相同。