Question

我有2个数组：一个是x坐标，另一个是y坐标。由于蒙特卡罗模拟，两者都是正态分布。我知道如何为这两个数组找到sigma和mu，并获得95％的置信区间：

[mu,sigma]=normfit(x_array);
hist(x_array);
x=norminv([0.025 0.975],mu,sigma)

但是，两个阵列都是相互关联的。为了绘制组合阵列的概率分布，我使用多元正态分布。在MATLAB中，这给了我：

[MuX,SigmaX]=normfit(x_array);
[MuY,SigmaY]=normfit(y_array);
mu = [MuX MuY];
Sigma=cov(x_array,y_array);
x1 = MuX-4*SigmaX:5:MuX+4*SigmaX; x2 = MuY-4*SigmaY:5:MuY+4*SigmaY;
[X1,X2] = meshgrid(x1,x2);
F = mvnpdf([X1(:) X2(:)],mu,Sigma);
F = reshape(F,length(x2),length(x1));
surf(x1,x2,F);
caxis([min(F(:))-.5*range(F(:)),max(F(:))]);
set(gca,'Ydir','reverse')
xlabel('x0-as'); ylabel('y0-as'); zlabel('Probability Density');

到目前为止一切顺利。现在我想计算95％的概率区域。我正在寻找mndinv的功能，就像norminv一样。然而，这样的功能在MATLAB中并不存在，这是有道理的，因为有无限的可能性......有人有关于如何获得95％概率区域的提示吗？提前致谢。

Answer 1

对于双变量情况，您可以添加其区域对应于NORMINV（95％）的ellispe。该椭圆是唯一标识的，并且为了证明，可以看到链接中的第一个源。

% Suppose you know the distribution params, or you got them from normfit()
mu    = [3, 7];
sigma = [1, 2.5
         2.5  9];

% X/Y values for plotting grid
x = linspace(mu(1)-3*sqrt(sigma(1)), mu(1)+3*sqrt(sigma(1)),100);
y = linspace(mu(2)-3*sqrt(sigma(end)), mu(2)+3*sqrt(sigma(end)),100);

% Z values
[X1,X2] = meshgrid(x,y);
Z       = mvnpdf([X1(:) X2(:)],mu,sigma);
Z       = reshape(Z,length(y),length(x));

% Plot
h = pcolor(x,y,Z);
set(h,'LineStyle','none')
hold on

% Add level set
alpha = 0.05;
r     = sqrt(-2*log(alpha));
rho   = sigma(2)/sqrt(sigma(1)*sigma(end));
M     = [sqrt(sigma(1)) rho*sqrt(sigma(end))
         0              sqrt(sigma(end)-sigma(end)*rho^2)];


theta = 0:0.1:2*pi;
f     = bsxfun(@plus, r*[cos(theta)', sin(theta)']*M, mu);
plot(f(:,1), f(:,2),'--r')

来源

Answer 2

要获得顶部所在的F的数值，您应该使用top5=prctile(F(:),95)。这将返回F的值，该值将前95％的数据限制为前5％。

然后你可以用

获得前5％

Ftop=zeros(size(F));
Ftop=F>top5;
Ftop=Ftop.*F;
%// optional: Ftop(Ftop==0)=NaN;
surf(x1,x2,Ftop,'LineStyle','none');

多元正态分布Matlab，概率区域

2 个答案:

来源