KMeansClustering初始化

时间:2011-04-24 13:50:55

标签: java speech-recognition

我有问题。我正在使用comirva包进行语音识别。我从音频文件中提取了MFCC系数。这个操作后我不知道怎么能继续。我学会了comirva.audio.util.kmeans.KMeansClustering类必须在MFCC之后使用。然后必须使用comirva.audio.util.gmm.GaussianComponent类。但我不知道如何初始化KMeansClustering类,然后是GaussianComponent类,然后又要做什么。请你帮忙。

2 个答案:

答案 0 :(得分:1)

你将你的MFCC系数转换为pointList(来自comirva的一个类),然后你创建一个k-MeansClustering(nCluster,pointList); 你运行它:kmeans.run();

然后创建一个GaussianComponent你可以这样做: gc = new GaussianComponent(kmeans.getWeight(ClusterIndex),kmeans.getMean(ClusterIndex),kmeans.getDiagCova。。;;

如果您想直接创建GMM,您可以这样做: gmm = new GaussianMixture(kmeans.getWeights,kmeans.getMeans ...);

答案 1 :(得分:0)

我不知道那个特定的库。但是为了初始化kmeans中心,存在几种方法。最常见的是:

  • 数据限制内的随机位置
  • 随机数据点

第一种方法通常更容易实现。对于第二个,您将必须创建数据样本索引的随机排列。