正确使用Unicode字符

时间:2018-10-02 21:32:10

标签: erlang otp

我正在尝试使用任何类型的字符保存二进制文件,例如:

$  LC_CTYPE=en_US.UTF-8 erl
Erlang/OTP 20 [erts-9.2] [source] [64-bit] [smp:8:8] [ds:8:8:10] [async-threads:10] [hipe] [kernel-poll:false] [dtrace]

Eshell V9.2  (abort with ^G)
1> TextBinaryWithSpecialChar =  <<" Hey, If you’re down, I’m here to help">>.                    
<<32,72,101,121,44,32,73,102,32,121,111,117,25,114,101,32,
  100,111,119,110,44,32,73,25,109,32,104,101,114,...>>
2> 

我该如何保存我想要的内容: <<“嘿,如果您不满意,我会在这里为您提供帮助” >>

1 个答案:

答案 0 :(得分:3)

1> <<"you’re"/utf8>>. 
<<121,111,117,226,128,153,114,101>>

在UTF-8中,“正确的单引号”由三个字节表示:

             Hex 
          Notation
           -------
1st byte:    E2 => E=14    2 
                   1110  0010 = 226

2nd byte:    80 =>  8     0
                   1000  0000 = 128

3rd byte:    99 =>  9     9
                   1001  1001 = 153

当您不为二进制文件指定utf8时,我不知道erlang如何获得“ {正确的单引号””。 (14 + 2 + 9 = 25?)

在erlang中,25只是列表"abc"的快捷方式,与二进制文件类似:

[97,98,99]

shell是否显示字符或数字无关:

5> <<97,98,99>>.
<<"abc">>