gnuplot比例绘图功能到相同的高度

时间:2016-01-01 18:32:45

标签: gnuplot

我正在绘制三个不同数据集的分布曲线。 它们具有不同的手段和标准偏差,因此具有不同的曲线。但是,在同一图表中,图表显示不同。

我使用普通曲线函数:

std_b=0.1674
mu_b=.6058
mu_j=0.8955
std_j=0.0373
mu_s=0.9330
std_s=0.0240
normal(x,mu,sd) = (1/(sd*sqrt(2*pi)))*exp(-(x-mu)**2/(2*sd**2))
plot normal(x,mu_b,std_b) w boxes title "Boolean",\
normal(x,mu_j,std_j) w boxes title "Jaccard",\
normal(x,mu_s,std_s) w boxes title "Sorensen"

然而,如果关闭曲线的比例,则由Y轴的差异看出。 如何缩放每个绘图函数,使它们都处于相同的Y高度?

enter image description here

1 个答案:

答案 0 :(得分:2)

一般来说,你不能。

这些是概率密度函数,这意味着它们必须是正的并且它们必须在曲线下具有正好1的区域(形式定义稍微更具技术性,但这是统计101定义)。因此,当你使曲线不那么分散时(这就是标准偏差所测量的),为了保持区域,你必须使中间的峰值更高。

如果有助于将其可视化,可以考虑等腰三角形的有限分布。

Sample Distributions

紫色和绿色三角形都形成完全有效的概率分布。在紫色分布的情况下,它具有长度为10(从0到10)和高度为1/5的基数,给出1的面积。如果我想使它覆盖更小的范围(这基本上也是如此)标准偏差在你的正常曲线中做了什么),我将两侧推(在这种情况下长度为6 - 从2到8),但为了保持1的面积,我必须使三角形更高(在这种情况下,高度为1/3)。如果我保持相同的高度,我的面积将小于1。

在正态分布中,y高度由指数函数前面的刻度控制。摆脱它,或将它们设置为相同将使它们具有相同的高度,但它们将不再是概率分布,因为该区域不会是1.通常,对于正态分布,标准越小偏差,高峰值。