Question

我正在阅读统计学习要素ESLII，在第2章中，他们有一个高斯混合数据集来说明一些学习算法。为了生成该数据集，它们首先从双变量高斯分布N（（1,0）'，I）生成10个均值。我不确定他们的意思？

如何从具有均值（1,0）的双变量分布中生成10个均值？

Answer 1

从双变量高斯分布生成的每个均值只是单个点，其采样方式与可从分布中生成的任何其他随机点完全相同。他们使用这些生成的点作为新分布的手段的事实是无关紧要的。

假设10个均值中的每一个都用于构造新的双变量高斯。

表示~N（（1,0），I）

其中〜表示从分布中提取的值。由于在这种情况下从中采样的分布是双变量高斯，因此每个采样的数据点将是一个二维点（x1，y1）。

然后，可以使用从原始分布中抽样的每个点进行新的分发。

示例：

means = [ (x1,y1), (x2,y2), ..., (x10,y10) ]

建立新的双变量高斯：

N1((x1,x2), I), N2((x2,y2), I), ..., N10((x10,y10), I)

他们只是使用初始的双变量高斯分布N（（1,0），I）作为一种简单的方法来选择10个正常分布的随机方法。