用户以下列形式输入数字:
1-800-432-4567
800-432-4567
800.432.4566
(800)432.4567
+1(800)-432-4567
800 432 4567
我希望将所有这些转换为剥离版本,而不使用像18004324567
这样的特殊字符。数据以String
的形式出现,因此不需要进行字符串检查。
我的方法如下:
def canonical_form number
a = remove_whitespaces number #to clear all whitespaces in between
a.gsub(/[()-+.]/,'')
end
def remove_whitespaces number
number.gsub(/\s+/,'') #removes all whitespaces
end
有更好的方法吗?可以使用canonical_form
方法中的正则表达式执行空格检查而无需额外的空格方法吗?如何以更简洁的方式对其进行重构或完成?
答案 0 :(得分:20)
如果String的tr
方法的第一个参数以^
开头,那么它表示除列出的字符以外的所有字符。
def canonical_form str
str.tr('^0-9', '')
end
答案 1 :(得分:11)
上面的几个解决方案 - 我对一些人感兴趣时进行了基准测试:
str = "1-800-432-4567"
Benchmark.ms { 10000.times{str.scan(/\d/).join} }
#=> 69.4419999490492
Benchmark.ms { 10000.times{str.delete('^0-9')} }
#=> 7.574999995995313
Benchmark.ms { 10000.times{str.tr('^0-9', '')} }
#=> 7.642999989911914
Benchmark.ms { 10000.times{str.gsub(/\D+/, '')} }
#=> 28.084999998100102
答案 2 :(得分:1)
您可以查找所有数字,而不是删除特殊字符。类似的东西:
str = "1-800-432-4567"
str.scan(/\d/).join
#=> "18004324567"
str = "(800)432.4567"
str.scan(/\d/).join
#=> "8004324567"