如何扩展String类,并附加名为to_bytes
的方法?
答案 0 :(得分:38)
String#bytes
通过字符串字节返回枚举器。 .to_a
可以将其转换为数组。
"asd".bytes.to_a
=> [97, 115, 100]
答案 1 :(得分:25)
Ruby已经有String#each_byte
方法,其别名为String#bytes
。
在Ruby 1.9之前,字符串等同于字节数组,即假定字符是单个字节。这适用于ASCII文本和各种文本编码,例如Win-1252和ISO-8859-1,但与Unicode严重失败,我们在网络上越来越常见。 Ruby 1.9+是Unicode识别的,字符串不再被认为是由字节组成,而是由字符组成,可以是多个字节长。
因此,如果您尝试将文本作为单个字节进行操作,则需要确保输入为ASCII,或者至少是基于单字节的字符集。如果您可能有多字节字符,则应使用String#each_char
或String.split(//)
或String.unpack
并使用U
标记。
中的//含义是什么
String.split(//)
//
与使用''
相同。告诉split
返回字符。您通常也可以使用chars
。
答案 2 :(得分:0)
在unpack的帮助下,我们可以将字符串转换为任何格式: - byte,bite(MSB,LSB),ASCII或hex。请通过以下链接: - http://blog.bigbinary.com/2011/07/20/ruby-pack-unpack.html。要将字符串转换为字节: -
"abcde".unpack('c*')
=> [97, 98, 99, 100, 101]