我将尝试通过R统计编程语言编写非常基本语音识别算法(语音到文本)。
计划是通过将口语单词样本记录到我的PC麦克风中来构建训练数据集,然后尝试使用合适的算法(例如神经网络)将口语短语与训练数据中记录的单词样本进行匹配或隐马尔可夫模型)。但是为了做到这一点,我首先需要将声音文件转换为原始数据。
我在使用麦克风讲话时是否会生成音频数据文件?音频数据文件我的意思是,例如,包含所录制声波测量值的文本文件(频率,幅度等) 。)每单位时间(毫秒?)。如果是这样,我该如何访问该文件?如果没有,是否有可以将音频文件转换为数据的应用程序?