我为说话人识别目的构建了GMM-UBM模型。模型的输出适合于每个说话者,通过对数似然比计算得分。现在我想将这些可能性分数转换为0到100之间的等值数。有人可以指导我吗?
答案 0 :(得分:0)
没有直截了当的公式。你可以做一些简单的事情,比如
prob = exp(logratio_score)
但这些可能无法反映数据的真实分布。计算出的样本概率百分比不会均匀分布。
理想情况下,您需要获取一个大型数据集并收集有关什么接受/拒绝率的统计数据。然后,一旦建立了直方图,您就可以通过该频谱图对得分差异进行标准化,以确保在您看到某个得分差异时,可以接受30%的受试者。该规范化将允许您创建均匀分布的概率百分比。请参阅示例How to calculate the confidence intervals for likelihood ratios from a 2x2 table in the presence of cells with zeroes
在扬声器识别系统中很少解决此问题,因为置信区间不是您想要显示的内容。您需要一个简单的接受/拒绝决定,因此您需要知道错误拒绝和接受率的数量。因此,仅仅找到一个阈值就足够了,而不是建立整个分布。