图2.5“统计学习要素”

时间:2012-09-05 18:07:58

标签: r machine-learning bayesian knn

我在计算图2.5的贝叶斯决策边界时遇到了一些困难。在包ElemStatLearn中,它已经计算了每个点的概率并使用轮廓绘制边界。谁能告诉我如何计算概率?非常感谢你。

在传统的贝叶斯决策问题中,混合分布通常是正态分布,但在本例中,它使用两个步骤来生成样本,因此我在计算分布时遇到一些困难。

非常感谢。

1 个答案:

答案 0 :(得分:1)

ESL的2.3.3节(在线访问)说明了如何生成数据。每个类别是具有相等协方差的10个高斯分布的混合,并且10个均值中的每一个都是从另一个双变量高斯分布中绘制的,如文中所指定的。要计算图2.5中模拟的确切决策边界,您需要知道为生成数据而生成的特定20个均值(每个类10个),但文本中未提供这些值。

但是,您可以生成一对新的混合模型,并计算您生成的两个类(BLUE& ORANGE)中每个类的概率。由于类中的10个分布中的每一个都具有相同的可能性,因此类条件概率p(x | BLUE)只是BLUE模型中10个分布中每个分布的概率的平均值。