如果我将其添加到我的脚本的开头:
$KCODE = 'UTF8'
require 'jcode'
然后我可以遍历包含unicode字符的单词的每个字符。想象一个包含变音符号或其他内容的单词,我会像这样迭代它们:
word.each_char do |c|
# do something with c
end
如果c
是unicode字符并且我打印它的大小,它将是2(由2个字符组成)。我如何获得c
的代码?是否有一些我可以使用的公式,或者std lib中有什么可以做到的?
答案 0 :(得分:3)
应该是:
c.unpack('U*').first