我不知道在哪里发帖。但是,这是一个普遍的问题。我编写语音激活软件,我有一个想法。
如果我要编程语音神经网络。最好采取哪些选择?
我知道Aforge使用模糊逻辑进行机器学习。但是,如果我想从头开始。
我会使用反向传播,也可能是递归学习。有没有办法可以提取MS Speech使用的默认语音声波文件,而不是将英语中的每个单词录制成声波。
我之前编写了前馈和后向传播神经网络。
我的问题是,此刻,有没有办法拉动声波文件来实现输入,还是需要将每个单词录制成声波?
我的长期目标是在未来3年内让我的程序区分句子结构,然后该程序就能将名词,动词,副词等等拼凑在一起。因此,它可以创建自己的句子来向用户询问问题。
除了声波,我不想使用开源。我可以处理编码。我只需要知道我是否可以拉MS语音声波,还是我需要自己录制?
答案 0 :(得分:0)
自然语言处理(NLP)是一种基于文本的机器理解方法。有一些非常好的论文可以帮助你开始:
https://openreview.net/pdf?id=B1-q5Pqxl
和
https://arxiv.org/pdf/1611.09830v2.pdf
MATCH-LSTM神经网络架构似乎是您所说的艺术的当前状态:
我的长期目标是在未来3年内完成我的计划 区分句子结构,那么程序就可以了 将名词,动词,副词等等拼凑在一起。所以它可以 创建自己的句子,向用户提问。
Wang和Jiang发布了一些示例代码:https://github.com/shuohangwang/SeqMatchSeq
你的目标是董事会,但我相信可以实现。已经达到了巨大的里程碑。祝你好运!