如何在给定方案中分配权重百分比

时间:2015-08-27 20:10:44

标签: c# arrays algorithm

问题 - 我的表X有随机行(可能是10行,100行等等)。现在我有体重的百分比,假设33%40%和27%

并命名为

A=33%
B=40%
C=27%

所以我添加了一个具有随机行百分比的列

****Row** |--Weight
row1  | A
row2  | C
row3 | B
.
.
.
row100 |B

假设表有1000行,那么权重应该像

一样随机分配
A= 330
B=400
c=270

我做了什么 - 对于以下程序,我必须根据价值分配分部。例如,在下面的代码中,我将值迭代为1000,但它将分配值,如

A=300
B=400
C=300

而不是

A= 250, B=450 C=300. As  weight are 25%,45%,30% 

对于任何n个数字,它应该是通用的,例如,在此代码中n = 1000(迭代):

  static void Main(string[] args)
    {
        //var t = Console.ReadLine().ToObservable();
        List<string> li = new List<string>();

        //t.Subscribe(m => Console.Write(m));
        for (int i = 1; i <= 1000; i++)
        {
            li.Add(GetSegment(i, "2.5,6.5,10.0", "A,B,C"));

        }
        Console.WriteLine("A Contains {0}",li.Count(x => x.Contains("A")));
        Console.WriteLine("B Contains {0}", li.Count(x => x.Contains("B")));
        Console.WriteLine("C Contains {0}", li.Count(x => x.Contains("C")));
        Console.ReadLine();
    }

    public static string GetSegment(long seed, string raw_segments, string segname)
    {

        var segmentsValue = raw_segments.Split(',').Select(entry => (double.Parse(entry))).ToArray();

        var segmentName = segname.Split(',').Select(entry => entry).ToArray();
        double theNumber = seed % 10;
        double index1 = segmentsValue.Where(entry => entry > theNumber).First();

        int index = Array.IndexOf(segmentsValue, index1);
        return segmentName[index].ToString();

    }

1 个答案:

答案 0 :(得分:1)

所以你有一些对象,你想根据一些集合分布将它们随机分配到三个箱子。例如,您想要bin A中的33%,bin B中的40%,以及bin C中剩余的27%。

如果您的发行版不必完全(即给定1,000个项目,bin A必须包含330个项目),那么这很容易:对于每一行,您生成一个随机的0到1,000之间的数字,并指定将行分配给适当的bin。例如:

int[] ranges = new int[]{330, 730, 1000};

var rnd = new Random();
for (var i = 0; i < 1000; ++i)
{
    var r = rnd.Next(1000);
    if (r < ranges[0])
        Console.WriteLine("bin A");
    else if (r < ranges[1])
        Console.WriteLine("bin B");
    else
        Console.WriteLine("bin C");
}

平均多次运行,这将使您在bin A中获得33%,在bin B中获得40%,在bin C中获得27%。但是对于任何个人来说,每个运行中的项目数量bin会有所不同。例如,在一次运行中,您最终可能会得到327,405,268。

通过一些工作,您可以调整该方法,以便它不会过度分配任何bin。基本上,当垃圾箱填满时,将其从范围列表中删除。您需要将您的范围列表设置为动态,以便您可以删除项目并继续工作,但它可以让您准确填充每个垃圾箱。

如果项目数量足够小,您可以创建一个数字从0到N的数组,随机播放,然后分配数字。例如:

// builds an array of numbers from 0 to 999.
var numbers = Enumerable.Range(0, 1000).ToArray();
Shuffle(numbers);

使用Fisher-Yates shuffle来重新排列数组。有关实施,请参阅https://gist.github.com/mikedugan/8249637(以及其他许多内容)。

现在你有一个数组,其中包含0到999之间的数字。这就像为每个记录预先分配一个唯一的随机数。因此,当您浏览记录列表时,您会在数字数组中查找相应的随机数。例如:

for (var i = 0; i < 1000; ++i)
{
    var value = numbers[i];
    char bin;
    if (value < 330) bin = 'A';
    else if (value < 730) bin = 'B';
    else bin = 'C';

    Console.WriteLine("Record {0} goes to bin {1}", i, bin);
}