我想将音频(例如:" .mp3")文件转换为文本文件。我尝试了不同的方法,例如pyspeech
和speech recognition
,但我没有得到任何答案。有没有其他方法可以做到这一点..?任何帮助,将不胜感激 !
答案 0 :(得分:3)
你试过https://pypi.python.org/pypi/SpeechRecognition/吗?这听起来就像你想要的那样。
我还通过此CMU Sphinx找到了blog项目。它也有Python绑定(如文章中所述)。
我找到的另一个项目是Google的Speech to Text API。您可能也想检查一下。这是关于这个主题的一个不错的教程:
答案 1 :(得分:1)
import speech_recognition as sr
print(sr.__version__)
r = sr.Recognizer()
file_audio = sr.AudioFile('file_audio.wav')
with file_audio as source:
audio_text = r.record(source)
print(type(audio_text))
print(r.recognize_google(audio_text))