如何在Elixir中循环遍历字符串中的每个字符?

时间:2016-04-03 01:36:15

标签: string loops functional-programming elixir

假设我有一个巨大的文本体〜字符串中存储了500个字符,每次遇到字符“a”时,我如何循环遍历字符串并将变量增加1?

2 个答案:

答案 0 :(得分:18)

我认为有更容易理解的方法可能对您有用。使用正则表达式:

Regex.scan(~r/a/, str) |> Enum.count

或将字符串分成其unicode字符,然后指望它:

str |> String.graphemes |> Enum.count(fn(c) -> c == "a" end)

这些不是非常有效的方法,但对于只有500个字符长的(相对较小的!)字符串,性能影响可以忽略不计。

如果您需要更有效的方法,一个好的选择通常是使用递归迭代,然后手动计算出现次数。虽然这种方法非常冗长,但它的表现要好得多。

defmodule Recursive do
  def count(str, <<c::utf8>>) do
    do_count(str, c, 0)
  end

  defp do_count(<<>>, _, acc) do
    acc
  end

  defp do_count(<<c::utf8, rest::binary>>, c, acc) do
    do_count(rest, c, acc + 1)
  end

  defp do_count(<<_::utf8, rest::binary>>, c, acc) do
    do_count(rest, c, acc)
  end
end

最后,这是使用迄今为止的方法的benchfella的基准。我还包括了@DeboraMartins的“分割长度”解决方案,它在小字符串方面优于上述所有内容。对于较大的字符串,递归方法的差异可以忽略不计。

# 500 Characters

split length         500000   5.90 µs/op
recursive            100000   10.63 µs/op
regex count          100000   24.35 µs/op
graphemes count       10000   118.29 µs/op


# 500.000 Characters

split length            100   11150.59 µs/op
recursive               100   12002.20 µs/op
regex count             100   25313.40 µs/op
graphemes count          10   218846.20 µs/op

答案 1 :(得分:8)

我对代码的消解是:

countSubstring = fn(_, "") -> 0
                 (str, sub) -> length(String.split(str, sub)) - 1 end

您可以使用IO.puts countSubstring.(str, "a")

致电