用Python转录音频文件

时间:2019-02-14 20:50:43

标签: python speech-recognition speech-to-text

我正在尝试转录一个很大的音频文件。其属性如下。

Size : 278.3 MB
Duration : 52 minutes
Format : WAV

Folllwoing是我的代码,用于将其转换为60秒的持续时间。您能建议一次转录此文件吗?

import speech_recognition as sr

r = sr.Recognizer()
with sr.AudioFile('sampleMp3.WAV') as source:
    audio = r.record(source, duration=60) 

command = r.recognize_google(audio)

text_file = open("Output.txt", "w")
text_file.write(command)
text_file.close()

1 个答案:

答案 0 :(得分:1)

speech_recognition python包只是一个包装,它甚至不提供基本功能。

如果您想使用Google Speech API(收费),可以执行以下操作:

https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master/speech/cloud-client/transcribe_async.py

如果您要考虑使用Bing,它还提供了类似的API,请参见How can I transcribe a speech file with the Bing Speech API in Python?

关于免费替代方案,请考虑https://github.com/alumae/kaldi-offline-transcriber