考虑这种情况 -
假设输出类的数量为9,每个输出类别表示特定的单词
(1)一个
(2)使用
(3)保持
(4)民事
(5)难以
(6)维生素
(7)确定
(8)家庭主妇
(9)激昂
我们给每个单词的多个wav文件作为输入(如果持续时间小于1秒,用零填充)到RNN以及与之关联的相应的一个热矢量。
因此,RNN已经学会了每秒输出一次类别标签
现在,我给它一个包含单词'a'和'use'的测试输入
问题1)RNN的输出是否是包含两个的矢量?
问题2)是否有可能确定检测到特定单词的中间步骤?
感谢。
答案 0 :(得分:0)
1)它可能,现在可能。网络可能会混淆。特别是如果测试输入包含紧密相互跟随的这些单词。因此,波形将受到共同作用的影响,并且可能无法识别单个单词。 2)如果你的意思是特定的时间,那么我认为这是可能的,但你必须调整你的训练。它不太可能从你问题中定义的任务中学习这个任务。