我有以下数据集,
1.54 23.66
1.75 26.25
1.92 30.20
2.08 34.46
2.44 42.08
2.78 46.81
3.03 51.10
3.70 52.99
4.17 56.15
4.76 59.34
计算标准偏差 (SD)前两点,我用,
stats "data.dat" u 2 every ::0::1
但是,这给了我错误 SD = 1.2950(正确为1.83)
* FILE:
Records: 2
Out of range: 0
Invalid: 0
Blank: 0
Data Blocks: 1
* COLUMN:
Mean: 24.9550
Std Dev: 1.2950
Sum: 49.9100
Sum Sq.: 1248.8581
Minimum: 23.6600 [0]
Maximum: 26.2500 [1]
Quartile: 23.6600
Median: 24.9550
Quartile: 26.2500 0
那么我做错了什么? TIA。
答案 0 :(得分:2)
当标准偏差按1.83
标准化时,获得您提及的sqrt(N-1)
的值,其中N
是样本大小。这样做是为了防止估计中的偏差。也就是说,使用来自总体的随机抽取样本计算标准偏差,使其预期值等于真实值。
Gnuplot stats
将提供的数据集视为总体,因此按sqrt(N)
进行标准化。因此1.29
的值也是正确的,您也可以将值从一个转换为另一个。
例如:将1.29
转换为1.83
乘以sqrt(N/N-1)
有关更完整的讨论,请点击此维基百科链接: