Question

我想将音频（例如：＆＃34; .mp3＆＃34;）文件转换为文本文件。我尝试了不同的方法，例如pyspeech和speech recognition，但我没有得到任何答案。有没有其他方法可以做到这一点..？任何帮助，将不胜感激！

Answer 1

你试过https://pypi.python.org/pypi/SpeechRecognition/吗？这听起来就像你想要的那样。

我还通过此CMU Sphinx找到了blog项目。它也有Python绑定（如文章中所述）。

我找到的另一个项目是Google的Speech to Text API。您可能也想检查一下。这是关于这个主题的一个不错的教程：

http://codeabitwiser.com/2014/09/python-google-speech-api/

Answer 2

import speech_recognition as sr
print(sr.__version__)
r = sr.Recognizer()

file_audio = sr.AudioFile('file_audio.wav')

with file_audio as source:
   audio_text = r.record(source)

print(type(audio_text))
print(r.recognize_google(audio_text))

音频文件到文本文件python

2 个答案: