鉴于字符串:
strs = [
"foo",
" ",
"Hello \n there",
" Ooh, leading and trailing space! ",
]
我想要一个简单的方法,按顺序识别所有连续的空白和非空白字符的运行,以及运行是否是空格:
strs.each{ |str| p find_whitespace_runs(str) }
#=> [ {k:1, s:"foo"} ],
#=> [ {k:0, s:" "} ],
#=> [ {k:1, s:"Hello"}, {k:0, s:" \n "}, {k:1, s:"World"} ],
#=> [
#=> {k:0, s:" "},
#=> {k:1, s:"Ooh,"},
#=> {k:0, s:" "},
#=> {k:1, s:"leading"},
#=> {k:0, s:" "},
#=> {k:1, s:"and"},
#=> {k:0, s:" "},
#=> {k:1, s:"trailing"},
#=> {k:0, s:" "},
#=> {k:1, s:"space!"},
#=> {k:0, s:" "},
#=> ]
这几乎可以工作,但只要字符串不以空格开头,就包含一个前导{k:0, s:""}
组:
def find_whitespace_runs(str)
str.split(/(\S+)/).map.with_index do |s,i|
{k:i%2, s:s}
end
end
真实世界的动机:编写a syntax highlighter,用于区分空白区域与非空白区域中的非空白区域。
答案 0 :(得分:5)
def find_whitespace_runs(str)
str.scan(/((\s+)|(\S+))/).map { |full, ws, nws|
{ :k => nws ? 1 : 0, :s => full }
}
end
答案 1 :(得分:0)
这有效,但我不喜欢unless empty?
(和compact
)的存在。
def find_whitespace_runs(str)
str.split(/(\S+)/).map.with_index do |s,i|
{k:i%2, s:s} unless s.empty?
end.compact
end
我很乐意提出任何产生正确结果的答案,并接受任何更优雅或更有效率的答案。