CMU Sphinx 5prealpha对齐问题

时间:2016-09-01 07:58:12

标签: cmusphinx

我使用sphinx 5prealpha进行对齐,但结果不好。我尝试了不同的AM和词典,结果总是一样的。当我使用相同的AM和字典与旧版本(sphinx4)时,我得到了非常好的结果。 对于此音频文件和文本: files

结果对于sphinx4而言并不适用于5prealpha。我相信如果你尝试使用任何法语AM和词典,你会看到差异。 有没有办法解决这个问题。任何帮助将不胜感激。

----更新----

我在这里尝试了两个AM和词典: Ester and SPhinx models

我正在使用此源代码:Sphinx source code

当我使用酯类AM和词典时,我希望得到(来自旧的狮身人面像版本4的结果): expected.txt

但我得到了(有5个prealpha: what_i_get.txt

我正在显示结果:

                        List<WordResult> wr = aligner.align(audioUrl, text);

                    for (WordResult result : wr) {

                        System.out.println(
                                result.getWord().toString() + " " + Long.toString(result.getTimeFrame().getStart())
                                        + "  " + Long.toString(result.getTimeFrame().getEnd()));
                    }

1 个答案:

答案 0 :(得分:0)

旧算法最适合像你这样的简短话语,新算法适用于很长的文件。所以新算法对于短语来说并不是那么好。

必须稍微修改对齐算法才能使其适用于大小写。我本打算在本周看一下,但可能还需要一些时间。