如何从ruby中删除字符串中的所有非数字?

时间:2016-02-24 13:27:15

标签: ruby

用户以下列形式输入数字:

1-800-432-4567
800-432-4567
800.432.4566
(800)432.4567
+1(800)-432-4567
800 432 4567

我希望将所有这些转换为剥离版本,而不使用像18004324567这样的特殊字符。数据以String的形式出现,因此不需要进行字符串检查。

我的方法如下:

def canonical_form number
  a = remove_whitespaces number #to clear all whitespaces in between
  a.gsub(/[()-+.]/,'')     
end

def remove_whitespaces number
  number.gsub(/\s+/,'')  #removes all whitespaces
end

有更好的方法吗?可以使用canonical_form方法中的正则表达式执行空格检查而无需额外的空格方法吗?如何以更简洁的方式对其进行重构或完成?

3 个答案:

答案 0 :(得分:20)

如果String的tr方法的第一个参数以^开头,那么它表示除列出的字符以外的所有字符。

def canonical_form str
  str.tr('^0-9', '')   
end

答案 1 :(得分:11)

上面的几个解决方案 - 我对一些人感兴趣时进行了基准测试:

str = "1-800-432-4567"
Benchmark.ms { 10000.times{str.scan(/\d/).join} }
#=> 69.4419999490492 

Benchmark.ms { 10000.times{str.delete('^0-9')} }
#=> 7.574999995995313 

Benchmark.ms { 10000.times{str.tr('^0-9', '')} }
#=> 7.642999989911914

Benchmark.ms { 10000.times{str.gsub(/\D+/, '')} }
#=> 28.084999998100102

答案 2 :(得分:1)

您可以查找所有数字,而不是删除特殊字符。类似的东西:

str = "1-800-432-4567"
str.scan(/\d/).join
#=> "18004324567"

str = "(800)432.4567"
str.scan(/\d/).join
#=> "8004324567"