应用错误收集

我最近编写了Naive Bayes的实现，将示例分为5个不同的组中的一个。特征的数量n非常大，并且每个特征可以是（1）或关闭（0）。使用训练集，我针对每个特征F _j估计每个组G _i的条件概率的5×n矩阵P，1≤i≤5,1≤ j≤n，使得单元（i，j）= P（G _i = 1 | F _j = 1）。（我忽略了概率P（G _i = 1 | F _j = 0），因为它们与本讨论无关。）

我想要做的是，给定一个新的例子E，一个1×n向量，将来自矩阵P的条件概率乘以对应于新例子中的特征。这样做我有两个顾虑：

非常多的功能意味着循环会很慢
重复乘法可能会导致精确度下降

我所做的是取P的对数，L = log（P），然后执行矩阵乘法E L'。乘法给出1×5结果，结果的最大值表示哪个组，假设先验概率大约相等。这通过矢量化解决速度问题，并通过获取日志来解决准确性问题（当然，采用日志将乘法转换为加法）。另一个优点是E L'适用于一组训练样例，其中E是矩阵而不是矢量。

我的问题是，这样的日志是合理/标准的方法吗？看起来它可能是显而易见的“101”方法，但我在实现这样的算法方面经验有限，所以我希望得到更多经验的人的反馈。

作为参考，在朴素贝叶斯方法中，贝叶斯定理给出了以g为条件的概率 F = f

P（G = g | F = f ）= P（ F = f | G = g）P（G = g）/ P（ F = f ）

将特征向量 F 扩展为F _1..n给出

P（G = g | F ₁ = f ₁，F ₂ = f ₂ .. .F _n = f _n）= P（F ₁ = f ₁，F _{2 < / sub> = f ₂ ... F _n = f _n | G = g）P（G = g）/ P（< strong> F = f ）}

应用独立特征的朴素假设

P（G = g | F ₁ = f ₁，F ₂ = f ₂ .. .F _n = f _n）= P（F ₁ = f ₁ | G = g）P（ F ₂ = f ₂ | G = g）... P（F _n = f _n | G = g）P（G = g）/ P（ F = f ）

分母可以被删除，因为它对所有g都是相同的，所以我们有

P（G = g | F ₁ = f ₁，F ₂ = f ₂ .. .F _n = f _n）αP（F ₁ = f ₁ | G = g）P（ F ₂ = f ₂ | G = g）... P（F _n = f _n | G =克）p（G = G）

这里，P（G = g）是先验概率。

是采取日志向量化重复乘法正确的方法？

1 个答案: