我按照这个例子来拟合两个法线的混合分布 你可以找到here。
x = [trnd(20,1,50) trnd(4,1,100)+3];
hist(x,-2.25:.5:7.25);
pdf_normmixture = @(x,p,mu1,mu2,sigma1,sigma2) ...
p*normpdf(x,mu1,sigma1) + (1-p)*normpdf(x,mu2,sigma2);
pStart = .5;
muStart = quantile(x,[.25 .75])
sigmaStart = sqrt(var(x) - .25*diff(muStart).^2)
start = [pStart muStart sigmaStart sigmaStart];
lb = [0 -Inf -Inf 0 0];
ub = [1 Inf Inf Inf Inf];
options = statset('MaxIter',300, 'MaxFunEvals',600);
paramEsts = mle(x, 'pdf',pdf_normmixture, 'start',start, ...
'lower',lb, 'upper',ub, 'options',options)
bins = -2.5:.5:7.5;
h = bar(bins,histc(x,bins)/(length(x)*.5),'histc');
h.FaceColor = [.9 .9 .9];
xgrid = linspace(1.1*min(x),1.1*max(x),200);
pdfgrid = pdf_normmixture(xgrid,paramEsts(1),paramEsts(2),paramEsts(3),paramEsts(4),paramEsts(5));
hold on
plot(xgrid,pdfgrid,'-')
hold off
xlabel('x')
ylabel('Probability Density')
请你解释一下它计算的原因
h = bar(bins,histc(x,bins)/(length(x)*.5),'histc');
它除以(length(x)*.5)
答案 0 :(得分:3)
我们的想法是缩放您的直方图,使其代表概率而不是计数。这是未缩放的直方图
垂直轴是每个箱内有多少事件的计数。您已将广告投放箱定义为-2.25:.5:7.25
,因此您的广告区宽度为0.5
。因此,如果我们查看直方图的第一个条形图,它会告诉我们x
中-2.5
中的元素数量(或实验中的事件数量)-2
到{{} 1}}(请注意0.5
的宽度)为2
。
但是现在你想将它与概率分布函数进行比较,我们知道PDF的积分是1
。这与PDF曲线下的区域1
相同。因此,如果我们希望直方图的垂直比例与第二张图片中的PDF相匹配
我们需要对其进行缩放,使得所有直方图条的总面积总和为1
。直方图的第一个条的区域是高度乘以宽度,根据我们上面的调查,2*0.5
。现在直方图中所有箱的宽度保持不变,因此我们可以通过将所有柱高加起来然后在结束时乘以宽度来找到其总面积。直方图中所有高度的总和是事件总数,即x
或length(x)
中的元素总数。因此,第一个直方图的面积为length(x)*0.5
,为了使此区域等于1
,我们需要将所有条形高度除以length(x)*0.5
。