如何将WAV文件转换为JSON文件

时间:2018-08-18 20:00:25

标签: python python-3.x audio wav

我有一个名为Student的WAV文件,现在我想将其转换为文本并以JSON文件下载此文本。

WAV文件(音频)具有以下内容“您好,我是Michel。我是乔治亚大学的学生”

JSON文件需要具有以上内容作为字符串。

基本上,将语音转换为文本。

1 个答案:

答案 0 :(得分:2)

很多语音识别软件都依赖于HMM或隐马尔可夫模型。这种方法的假设是,在足够短的时间尺度(例如10毫秒)上查看语音信号时,可以合理地将其近似为固定过程,即统计属性不会随时间变化的过程。语音被分为10毫米的片段,并映射到称为cepstral系数的实数向量,然后将这些向量与音素匹配。这是典型语音识别系统的非常高的概述。

现在,回到您的要求后,只需进行一些研究便可以将您带到-

现在使用SpeechRecognition很简单(从source code提取并在我的计算机上尝试过)-

import speech_recognition as sr
from os import path
AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), "english.wav")
r = sr.Recognizer()
with sr.AudioFile(AUDIO_FILE) as source:
    audio = r.record(source)  # read the entire audio file
try:
    print("Sphinx thinks you said " + r.recognize_sphinx(audio))
except sr.UnknownValueError:
    print("Sphinx could not understand audio")
except sr.RequestError as e:
    print("Sphinx error; {0}".format(e))

瞧,它的工作原理是在行中,这要归功于开发这些的惊人的人:)

编辑-您需要设置PocketSphinx才能使此代码正常工作。