利用高斯混合模型进行二进制分类

时间:2013-03-14 04:38:39

标签: machine-learning pattern-matching speech-recognition speaker

我想为决策边界实现T = Log(f(x | client)) - Log(f(x | impostor))。我的培训和测试功能是20 * 12。 我已经应用了voicebox matlab工具箱。我写了以下MATLAB代码:

if max(lp_client)- max(lp_impostor) >0.35
   disp('accept');
else
   disp('reject');
end

我应该使用对数概率的平均值还是对数概率的最大值?

1 个答案:

答案 0 :(得分:2)

由于估算的概率性质,您应该使用lp_client的和。如果你有一系列独立事件(在这个模型中经常假设特征独立性),它的概率是每个事件概率的乘积:

P(Seq | X)= P(feat1 | x)* P(feat2 | X)......

或在日志域

logP(Seq | X)= logP(feat1 | x)+ logP(feat2 | X)

实际上

logP(x | client)= sum(lp_client)

logP(x | impostor)= sum(lp_impostor)