标签: audio
我们有3个小时的音频,每个音频包含两个人中的一个说话或沉默。我们需要确定每个时刻中哪些选项对应于使用hmm。
为此,当波浪形状不同(正弦,锯齿,方形等)时会产生不同输出的一些非疯狂困难的功能,但不同音量,音高等的答案相同。
这个项目可行吗?