决定Sphinx-4中扬声器适配的簇大小

时间:2016-08-31 14:30:07

标签: speech-recognition cmusphinx sphinx4

在用于扬声器适配技术的CMU Sphinx(Sphinx-4)中,我使用以下代码片段

Stats stats = recognizer.createStats(nrOfClusters);
recognizer.startRecognition(stream);
while ((result = recognizer.getResult()) != null) {
    stats.collect(result);
}
recognizer.stopRecognition();

// Transform represents the speech profile
Transform transform = stats.createTransform();
recognizer.setTransform(transform);

什么应该是nrOfClusters(簇数)参数值才能获得好的结果?我们如何使用此代码段来适应音频中的多个扬声器?

1 个答案:

答案 0 :(得分:0)

  

什么应该是nrOfClusters(簇数)参数值才能获得好的结果?

群集数量取决于适应的数据量。您拥有的数据越多,您可以使用的群集就越多。例如,如果您有30秒的语音,则1个群集就足够了。如果您有10分钟的演讲时间,则最多可以使用32个集群。

  

我们如何使用此代码段来适应音频中的多个扬声器?

如果你知道每个扬声器的时间,你可以分别为每个扬声器进行调整。为不同的发言者创建共享变换没有多大意义。