Question

我使用sphinx 5prealpha进行对齐，但结果不好。我尝试了不同的AM和词典，结果总是一样的。当我使用相同的AM和字典与旧版本（sphinx4）时，我得到了非常好的结果。对于此音频文件和文本： files

结果对于sphinx4而言并不适用于5prealpha。我相信如果你尝试使用任何法语AM和词典，你会看到差异。有没有办法解决这个问题。任何帮助将不胜感激。

----更新----

我在这里尝试了两个AM和词典： Ester and SPhinx models

我正在使用此源代码：Sphinx source code

当我使用酯类AM和词典时，我希望得到（来自旧的狮身人面像版本4的结果）： expected.txt

但我得到了（有5个prealpha： what_i_get.txt

我正在显示结果：

                        List<WordResult> wr = aligner.align(audioUrl, text);

                    for (WordResult result : wr) {

                        System.out.println(
                                result.getWord().toString() + " " + Long.toString(result.getTimeFrame().getStart())
                                        + "  " + Long.toString(result.getTimeFrame().getEnd()));
                    }

Answer 1

旧算法最适合像你这样的简短话语，新算法适用于很长的文件。所以新算法对于短语来说并不是那么好。

必须稍微修改对齐算法才能使其适用于大小写。我本打算在本周看一下，但可能还需要一些时间。

CMU Sphinx 5prealpha对齐问题

1 个答案: