如何从扬声器分类中断音频文件

时间:2014-03-25 12:03:43

标签: speech-recognition

我最近开始使用LIUM工具。对于我的音频文件,我能够获得段文件。

请帮助我在分段文件的帮助下破坏输入音频文件。

以下是我为以下命令获得的段文件

D:\Jar_files>java -Xmx1024m -jar ./LIUM_SpkDiarization-8.4.1.jar --fInputMask=Amala.wav 
--sOutputMask=gsd.seg  --doCEClustering  GSD


;; cluster S0 [ merge HCLR 2 = S0 in S12 with 1.5410836397413505 ] [ merge HCLR 3 = S0 in S1 with 1.6226113910564284 ] [ score:FS = -33.252216872332376 ] [ score:FT = -33.621459953603306 ] [ score:MS = -33.524596374083096 ] [ score:MT = -34.046138016418915 ] 

GSD 1 0 229 F S U S0

GSD 1 229 443 F S U S0

GSD 1 672 620 F S U S0

GSD 1 1292 1117 F S U S0

GSD 1 2409 1183 F S U S0

GSD 1 3592 501 F S U S0

GSD 1 4093 1026 F S U S0

GSD 1 5119 1410 F S U S0

GSD 1 6529 785 F S U S0

GSD 1 7315 180 F S U S0

GSD 1 7495 193 F S U S0

GSD 1 7701 338 F S U S0

GSD 1 8039 824 F S U S0

GSD 1 8863 1185 F S U S0

GSD 1 10250 647 F S U S0

GSD 1 10897 174 F S U S0

GSD 1 11480 1435 F S U S0

GSD 1 13529 206 F S U S0

GSD 1 13939 1230 F S U S0

GSD 1 16192 618 F S U S0

GSD 1 16810 1022 F S U S0

GSD 1 18240 411 F S U S0

GSD 1 19265 717 F S U S0

GSD 1 19982 718 F S U S0

GSD 1 21518 411 F S U S0

GSD 1 23363 616 F S U S0

GSD 1 24387 1940 F S U S0

GSD 1 26327 595 F S U S0

GSD 1 26922 994 F S U S0

GSD 1 27916 424 F S U S0

GSD 1 28340 1997 F S U S0

GSD 1 30337 961 F S U S0

1 个答案:

答案 0 :(得分:0)

逐行读取文件,在单词上拆分行。第三个字是以帧开始(1/100秒),下一列是长度。最后一列是发言人ID。如果您知道块的开始和结束,则可以剪切相应的音频。你可以在这里找到剪切音频文件的代码:

cutting a wave file

如果你想使用java以外的编程语言,你也可以在SO上搜索代码来剪切文件。