PHP基于值频率生成数组

时间:2017-04-18 21:05:38

标签: php arrays frequency-distribution

我正在尝试理解根据它们应该发生的频率构建有序数组的最佳方法。根据字符的频率和结果排序,结果数组可能有零到一些重复字符。以下是示例数据的细分:

字符频率

a => 0.05
b => 0.05
c => 0.1
d => 0.1
e => 0.2
f => 0.5

结果示例:

['b', 'd', 'a', 'f']
['f', 'f', 'c', 'a']
['e', 'c', 'a', 'f']
['a', 'e', 'f', 'd']

这里的数学肯定不准确;它只是为了演示以前的陈述。我关注数组的顺序,而某些可能有重复的字符。

这是构建数组的基本循环。这里设计的rand()方法是为了保留这篇文章所有不同的令人发指的数学方法,我试图将这个问题保持直接和仅仅是概念性的。

$frequencies = [
    'a' => 0.05,
    'b' => 0.05,
    'c' => 0.1,
    'd' => 0.1,
    'e' => 0.2,
    'f' => 0.5
];

$characters = 'abcdef';
$charactersLength = strlen($characters);
$result = [];
for ($i = 0; $i < 4; $i++) {
    // $result[] = $this->getCharacterByFrequency();
    $result[] = $characters[rand(0, $charactersLength - 1)];
}

1 个答案:

答案 0 :(得分:1)

很高兴看看是否有人有更有效的方法来做到这一点。我确定存在一个。

$frequencies = [
    'a' => 0.05,
    'b' => 0.05,
    'c' => 0.1,
    'd' => 0.1,
    'e' => 0.2,
    'f' => 0.5
];

$result = [];
for ($i = 0; $i < 4; ++$i) {
    $r = mt_rand() / mt_getrandmax();
    foreach ($frequencies as $letter => $frequency) {
      $r -= $frequency;
      if ($r < 0) break;
    }
    $result[] = $letter;
}

我用100000个结果测试了代码并得到了准确的结果。

array (size=6)
'a' => float 0.0503105
'b' => float 0.0496805
'c' => float 0.099721
'd' => float 0.100001
'e' => float 0.201242
'f' => float 0.499055