应用错误收集

时间：2012-09-05 18:07:58

标签： r machine-learning bayesian knn

我在计算图2.5的贝叶斯决策边界时遇到了一些困难。在包ElemStatLearn中，它已经计算了每个点的概率并使用轮廓绘制边界。谁能告诉我如何计算概率？非常感谢你。

在传统的贝叶斯决策问题中，混合分布通常是正态分布，但在本例中，它使用两个步骤来生成样本，因此我在计算分布时遇到一些困难。

非常感谢。

答案 0 :(得分：1)

ESL的2.3.3节（在线访问）说明了如何生成数据。每个类别是具有相等协方差的10个高斯分布的混合，并且10个均值中的每一个都是从另一个双变量高斯分布中绘制的，如文中所指定的。要计算图2.5中模拟的确切决策边界，您需要知道为生成数据而生成的特定20个均值（每个类10个），但文本中未提供这些值。

但是，您可以生成一对新的混合模型，并计算您生成的两个类（BLUE＆amp; ORANGE）中每个类的概率。由于类中的10个分布中的每一个都具有相同的可能性，因此类条件概率p（x | BLUE）只是BLUE模型中10个分布中每个分布的概率的平均值。