在Excel中创建概率分布

时间:2019-06-27 16:19:53

标签: excel graph distribution

给了我三个数据点,并告诉我进行分配。 这是我完成任务的说明:

  

本月排名最低的20个百分点将产生13个单位。数据的中位数显示我们本月应该生产23个单位。最好的情况是,排名前20位的百分比显示本月我们生产了30个单位。

这是指试图找出一个月内生产一定数量零件的可能性百分比。

我尝试过像这样分发: enter image description here

但是,我希望产生如下所示的概率分布: enter image description here

我正在使用的数据(从上面老板的指示中总结)如下:

| Serial Number | Median Projected Finish Date | Median In July | Best Case Projected Finish Date | Best In July | Worst Case Projected Finish Date | Worst In July |
|:-------------:|:----------------------------:|:--------------:|:-------------------------------:|:------------:|:--------------------------------:|:-------------:|
|      8473     |           7/18/2019          |        1       |            6/28/2019            |       1      |             8/2/2019             |       0       |
|     11963     |           6/30/2019          |        1       |            6/28/2019            |       1      |             7/28/2019            |       1       |
|     15165     |           6/27/2019          |        1       |            6/27/2019            |       1      |             6/28/2019            |       1       |
|     28023     |           7/1/2019           |        1       |            6/29/2019            |       1      |             7/3/2019             |       1       |
|     14355     |           9/1/2019           |        0       |            7/11/2019            |       1      |             9/13/2019            |       0       |
|     14388     |           7/3/2019           |        1       |             7/1/2019            |       1      |             7/7/2019             |       1       |
|      796      |           7/18/2019          |        1       |            6/28/2019            |       1      |             8/2/2019             |       0       |
|     20574     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/19/2019            |       1       |
|      6518     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/19/2019            |       1       |
|     19969     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/18/2019            |       1       |
|     10244     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/19/2019            |       1       |
|      9980     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/19/2019            |       1       |
|     26056     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/19/2019            |       1       |
|      8849     |           7/18/2019          |        1       |             7/2/2019            |       1      |             8/2/2019             |       0       |
|      7409     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/19/2019            |       1       |
|      1386     |           7/11/2019          |        1       |             7/9/2019            |       1      |             7/19/2019            |       1       |
|     13971     |           7/17/2019          |        1       |            6/27/2019            |       1      |             8/1/2019             |       0       |
|     21974     |           7/25/2019          |        1       |            7/19/2019            |       1      |             8/12/2019            |       0       |
|     20546     |           7/25/2019          |        1       |            7/19/2019            |       1      |             8/12/2019            |       0       |
|     10055     |           6/30/2019          |        1       |            6/27/2019            |       1      |             7/28/2019            |       1       |
|     22766     |           7/17/2019          |        1       |            6/27/2019            |       1      |             8/1/2019             |       0       |
|     12679     |           7/18/2019          |        1       |             7/2/2019            |       1      |             8/2/2019             |       0       |
|     28837     |           7/26/2019          |        1       |            6/30/2019            |       1      |             8/14/2019            |       0       |
|     12509     |           7/31/2019          |        1       |             7/4/2019            |       1      |             8/18/2019            |       0       |
|      1624     |           8/5/2019           |        0       |            7/29/2019            |       1      |             8/21/2019            |       0       |
|      5689     |           8/1/2019           |        0       |             7/4/2019            |       1      |             8/19/2019            |       0       |
|     29315     |           8/2/2019           |        0       |             7/5/2019            |       1      |             8/29/2019            |       0       |
|     10618     |           8/2/2019           |        0       |             7/5/2019            |       1      |             8/29/2019            |       0       |
|     16235     |           8/2/2019           |        0       |             7/5/2019            |       1      |             8/29/2019            |       0       |
|     12079     |           8/2/2019           |        0       |             7/5/2019            |       1      |             8/29/2019            |       0       |
|               |                              |       23       |                                 |      30      |                                  |       13      |

上面的数据源概述了零件的唯一标识符,该序列号的预计完成日期,预计完成日期(如果完成该步骤的最佳/最差时间是20%)以及“在7月”列中查看该操作是否在7月(用于汇总最后一行的总数)中完成。

我曾尝试关注this resource,但未能这样做。如何使用数据创建概率分布?

目标是找出在给定月份(例如2019年7月)完成x个单位数量的可能性为多少。我只能使用上面的数据。能够显示(或接近显示)的图形有一个11% probability of finishing 32 units in 2019(任意)。理想情况下,概率分布将向我们显示完成x个单位数量的概率。我想最低限度为0,最高限度为30(因为仅列出了30个项目)。

1 个答案:

答案 0 :(得分:1)

您可以将每个单元的完成日期作为随机变量查看。对于每个单元,您将获得三个概率。对于第一个单位,P(U 1 <6/28)= 0.2,P(U 1 > 8/2)= 0.2,P(U 1 <7/18)= 0.5,其中7/18是中位数。

如果我们假设U 1 是正态分布的,则其中值和平均值等于7/18,并且概率P(U 1 1 )= 0.2且P(U 1 > k 2 )= 0.2必须适用于k 1 和k 2 与平均值7/18等距。 U 1 并非如此,这表明U 1 最有可能不是正态分布。您可能需要考虑其他偏斜的概率分布,并且中位数为0.5概率。有Exponentially modified Gaussian distributionSkew normal distribution等。无论您对单位生产有什么了解,都可以帮助选择概率分布。

假设我们要使用正态分布。除了使用日期,我们还将使用第1天为7/1的日期编号。我们需要为每个单位估计其正态分布的参数,即在给定三个概率点的情况下的均值和标准差。由于正态分布是对称的,因此平均值是最差/最好的20%天之间的中间天。对于U 1 ,平均值应为m 1 =(33-(-2))/ 2 + -2 = 15.5。我们知道P(U 1 > 33)= 0.2。当N(0; 1)> 0.84时会发生这种情况。因此,标准偏差s 1 =(33-15.5)/ 0.84 = 20.8。知道m 1 和s 1 ,我们可以计算U 1 在7月完成的概率,即P(U 1 〜N(m 1 ; s 1 )<32)。对所有N个单位进行相同的估算。这样就得出了N个概率,即单位在7月完成的概率。

要计算N个单位中的R个单位在7月完成的概率,请参考以下答案。

最后,假设单位的生产是独立的。如果不是这种情况(例如,两个单元依赖于共同的零件供应商),则计算出的概率可能不好。但是我认为最好的改进是找到一种比正常分布更能代表您的数据的分布。