删除红宝石中的子串

时间:2010-02-05 08:59:07

标签: ruby regex string

给定一个字符串数组

array1 = ["abcdwillbegoneabcccc","cdefwilbegokkkabcdc"]

和另一个由例如图案组成的字符串数组["abcd","beg[o|p]n","bcc","cdef","h*gxwy"]

任务是删除与任何模式字符串匹配的子字符串。例如,此案例的示例输出应为:

["willbegonea","wilbegokkk"]

因为我们已经删除了匹配其中一个模式的子串(根据发生的位置,匹配的匹配或匹配)。假设一个或两个匹配将始终发生在array1中每个字符串的开头或结尾处。

在ruby中对上述优雅解决方案的任何想法?

3 个答案:

答案 0 :(得分:7)

如何构建单个正则表达式?

array1 = ["abcdwillbegoneabcccc","cdefwilbegokkkabcdc"]

to_remove = ["abcd","beg[o|p]n","bcc","cdef","h*gxwy"]

reg = Regexp.new(to_remove.map{ |s| "(#{s})" }.join('|'))
#=> /(abcd)|(beg[o|p]n)|(bcc)|(cdef)|(h*gxwy)/

array1.map{ |s| s.gsub(reg, '') }
#=>  ["willeacc", "wilbegokkkc"]

请注意,我的结果与您的

不同
["willbegonea","wilbegokkk"]

但我认为我的是正确的,它从原版中移除了“abcd”,“begon”和“bcc”,这似乎是想要的。

答案 1 :(得分:2)

我可以在这里看到一些潜在的问题,因为如果你改变模式字符串的顺序,你可能会得到不同的结果;而且,第二种模式可能会使字符串处于与第一种模式匹配的状态,现在只是为时已晚。

假设这些是赠品,我会选择Yoann的回答。我可以稍微改进它的唯一方法是使模式regexen而不是字符串,如下所示:

[/abcd/,/beg[o|p]n/,/bcc/,/cdef/,/h*gxwy/].each do |pattern|
    string_to_test.gsub!(pattern,'')
end

但当然,如果模式来自其他地方,也许它们必须是字符串。

答案 2 :(得分:1)

我觉得这样的事情应该有效:

def gimme_the_substring(string_to_test)
  ["abcd","beg[o|p]n","bcc","cdef","h*gxwy"].each do |pattern|
    string_to_test.gsub!(/#{pattern}/,'')
  end
  return string_to_test
end

array1.map!{|s| gimme_the_substring(s)}