我有一个来自用户输入的字符串,格式如下:
"foo\U+FFE2\U+FFB5\U+FFE2\U+FFB5"
当我查看它时,它在浏览器或终端中没有显示任何内容,但它们肯定存在。
它们是什么?我如何删除所有这些垃圾字符,最后只是'foo'?
我知道我可以删除这些特定的那些,但可能还有其他不同的我想要的文本值。
有什么想法吗?
答案 0 :(得分:1)
我看到两个主要变体:
#split
/ #join
对:
"fooффф".split('').select{|x|x.ord <= 127}.join
# => "foo"
#unpack
/ #pack
对:
"fooффф".unpack('U*').select{|x| x <= 127}.pack('U*')
# => "foo"