Ruby中的百分比编码

时间:2015-07-09 12:55:31

标签: ruby percent-encoding

在Ruby中,我通过

得到'ä'的百分比编码
require 'cgi'
CGI.escape('ä')
=> "%C3%A4"

相同
'ä'.unpack('H2' * 'ä'.bytesize)
=> ["c3", "a4"]

我有两个问题:

  1. 第一次操作的反转是什么?不应该是

    ["c3", "a4"].pack('H2' * 'ä'.bytesize)
    => "\xC3\xA4"
    
  2. 对于我的应用程序,我需要将'ä'编码为“%E4”,这是'ä'.ord的十六进制值。有没有Ruby方法呢?

1 个答案:

答案 0 :(得分:3)

正如我在评论中提到的,将字符ä等同为代码点228(0xE4)意味着您正在处理ISO 8859-1 character encoding

所以,你需要告诉Ruby你想要的字符串编码。

str1 = "Hullo ängstrom" # uses whatever encoding is current, generally utf-8
str2 = str1.encode('iso-8859-1')

然后你可以随意编码:

require 'cgi'
s2c = CGI.escape str2
#=> "Hullo+%E4ngstrom" 

require 'uri'
s2u = URI.escape str2
#=> "Hullo%20%E4ngstrom" 

然后,要反转它,你必须首先(a)取消该值,然后(b)将编码转回到你习惯的(可能是UTF-8),告诉Ruby什么字符编码它应该将代码点解释为

s3a = CGI.unescape(s2c)  #=> "Hullo \xE4ngstrom"
puts s3a.encode('utf-8','iso-8859-1')
#=> "Hullo ängstrom"

s3b = URI.unescape(s2u)  #=> "Hullo \xE4ngstrom"
puts s3b.encode('utf-8','iso-8859-1')
#=> "Hullo ängstrom"