Question

我一直在尝试在Julius上转录一些音频样本，用于涉及语音到文本转换的项目。音频输入的两端似乎都被切碎了，我看不到如何控制麦克风输入的录制时间。

当我尝试使用给定的示例文件时，输出相当不错，该示例文件长达一分钟，由几个短语组成。该模型准确地划分了词组，并在转录它们时做得不错（将几个词在适当的位置切出）

这是我的麦克风输入配置文件：输入麦克风 -htkconf wav_config -h ENVR-v5.3.am -hlist ENVR-v5.3.phn -d ENVR-v5.3.lm -v ENVR-v5.3.dct -b 4000 -lmp 12 -6 -lmp2 12 -6 -fallback1pass -多路径 -iwsp -iwcd1最大 -spmodel sp -no_ccd -9月150 -b2 360 -n 40 -s 2000 -米8000 -lookuprange 5 -SB 80 -forcedict

这是文件输入的配置文件

-input file
-filelist test.dbl
-htkconf wav_config
-h ENVR-v5.3.am
-hlist ENVR-v5.3.phn
-d ENVR-v5.3.lm
-v ENVR-v5.3.dct
-b 4000
-lmp 12 -6
-lmp2 12 -6
-walign
-fallback1pass
-multipath
-iwsp
-norealtime
-iwcd1 max
-spmodel sp
-spsegment
-gprune none
-no_ccd
-sepnum 150
-b2 360
-n 40
-s 2000
-m 8000
-lookuprange 5
-sb 80
-forcedict
-cutsilence

转录只是一个单词'ahead'

真正的声音-'他知道伟大的年轻女演员的技巧'

有什么方法可以控制Julius中麦克风和文件输入的录音长度？

0 个答案: