我使用sphinx 5prealpha进行对齐,但结果不好。我尝试了不同的AM和词典,结果总是一样的。当我使用相同的AM和字典与旧版本(sphinx4)时,我得到了非常好的结果。 对于此音频文件和文本: files
结果对于sphinx4而言并不适用于5prealpha。我相信如果你尝试使用任何法语AM和词典,你会看到差异。 有没有办法解决这个问题。任何帮助将不胜感激。
----更新----
我在这里尝试了两个AM和词典: Ester and SPhinx models
我正在使用此源代码:Sphinx source code
当我使用酯类AM和词典时,我希望得到(来自旧的狮身人面像版本4的结果): expected.txt
但我得到了(有5个prealpha: what_i_get.txt
我正在显示结果:
List<WordResult> wr = aligner.align(audioUrl, text);
for (WordResult result : wr) {
System.out.println(
result.getWord().toString() + " " + Long.toString(result.getTimeFrame().getStart())
+ " " + Long.toString(result.getTimeFrame().getEnd()));
}
答案 0 :(得分:0)
旧算法最适合像你这样的简短话语,新算法适用于很长的文件。所以新算法对于短语来说并不是那么好。
必须稍微修改对齐算法才能使其适用于大小写。我本打算在本周看一下,但可能还需要一些时间。