我一直在尝试在Julius上转录一些音频样本,用于涉及语音到文本转换的项目。音频输入的两端似乎都被切碎了,我看不到如何控制麦克风输入的录制时间。
当我尝试使用给定的示例文件时,输出相当不错,该示例文件长达一分钟,由几个短语组成。该模型准确地划分了词组,并在转录它们时做得不错(将几个词在适当的位置切出)
这是我的麦克风输入配置文件: 输入麦克风 -htkconf wav_config -h ENVR-v5.3.am -hlist ENVR-v5.3.phn -d ENVR-v5.3.lm -v ENVR-v5.3.dct -b 4000 -lmp 12 -6 -lmp2 12 -6 -fallback1pass -多路径 -iwsp -iwcd1最大 -spmodel sp -no_ccd -9月150 -b2 360 -n 40 -s 2000 -米8000 -lookuprange 5 -SB 80 -forcedict
这是文件输入的配置文件
-input file
-filelist test.dbl
-htkconf wav_config
-h ENVR-v5.3.am
-hlist ENVR-v5.3.phn
-d ENVR-v5.3.lm
-v ENVR-v5.3.dct
-b 4000
-lmp 12 -6
-lmp2 12 -6
-walign
-fallback1pass
-multipath
-iwsp
-norealtime
-iwcd1 max
-spmodel sp
-spsegment
-gprune none
-no_ccd
-sepnum 150
-b2 360
-n 40
-s 2000
-m 8000
-lookuprange 5
-sb 80
-forcedict
-cutsilence
转录只是一个单词'ahead'
真正的声音-'他知道伟大的年轻女演员的技巧'