ruby删除ctrl-H字符

时间:2016-12-14 09:16:11

标签: ruby regex

在我的一个日志文件中,我有以下隐藏值和颜色ASCII代码,

...WAITING^H^H^H^H^H^H^H^H^H^H

我可以使用以下方法删除颜色ASCII代码,

gsub(/\e\[(\d+)(;(\d+))?m/, '')

但仍然无法删除上面提到的隐藏字符。有没有办法让他们摆脱?

1 个答案:

答案 0 :(得分:7)

理论

退格?

如果ctrl-H个字符是退格符:

puts "foo\b\b\bbar"
#=> "bar"

puts "foo\b\b\bbar".delete("\b")
#=> "foobar"

注意:delete在这里没问题,因为我们只使用一个字符。

或" ^ H" substring?

如果ctrl-H字符为"^H"

puts "foo^H^H^Hbar".gsub(/\^H/,'')
#=> "foobar"

注意:delete不会在这里工作,因为它也会从字符串中删除每个H字符,而不仅仅是子字符串^H。此外,使用delete("^H")表示delete every character that isn't a 'H'。所以:

"foo^H^H^Hbar".delete("^H") => "HHH"

测试

使用:

bytes = [46, 46, 46, 87, 65, 73, 84, 73, 78, 71, 8, 8, 8, 8, 8, 8, 8, 8, 8, 8, 91, 32, 32, 32, 79, 75, 32, 32, 32, 93, 10, 27, 91, 63, 49, 50, 108, 27, 91, 63, 50, 53, 104, 68, 111, 110, 101, 33, 10, 10]

我们得到:

string = bytes.map(&:chr).join
string # => "...WAITING\b\b\b\b\b\b\b\b\b\b[   OK   ]\n\e[?12l\e[?25hDone!\n\n"
puts string
# [   OK   ]
# Done!
#

等于8的字节是退格,当与WAITING一起显示时,它们会删除puts。 第一种选择应该可以正常工作:

puts string.delete("\b")
# ...WAITING[   OK   ]
# Done!

注意:这仅适用于原始数据,其中退格是字节8。任何复制粘贴,使用cat|或文本编辑器都可能会将这些转换为"^H"或其他字符串。