AWS Lambda函数中的音频文件到文本的转换

时间:2019-01-17 07:00:09

标签: python amazon-web-services audio aws-lambda speech-to-text

我正在尝试使用Speech_regcognition python包将音频文件转换为文本。但是它仅适用于非常小的音频文件(假设10秒)。但是我必须转换一个超过60秒的音频文件。我知道我可以使用Google Speech API将音频文件转换为文本,但这是付费服务。我不想使用付费服务。因此,现在我计划将原始音频文件拆分为多个小音频文件。假设如果我有60秒的音频文件,我会将每个部分转换为10秒的音频文件。将音频文件上传到S3存储桶后,我将尝试在AWS Lambda服务中执行此操作。这样我就可以使用此speech_recognition免费服务,而无需使用Google API密钥(付费)。

我的问题:如果我使用此方法,它将在我在AWS Lambda服务中使用该方法时造成任何问题或Google服务可以识别吗?

注意:此音频文件到文本文件的转换AWS Lambda函数将执行超过数百万次。

1 个答案:

答案 0 :(得分:1)

我建议您使用Amazon Transcribe节省一些时间和麻烦。与您的AWS Lambda函数集成将很容易。

如果您担心costs,则有一个免费套餐

  

每月60分钟,为期12个月

     

从您创建第一个转录请求之日起,您就可以使用Amazon Transcribe免费套餐12个月。当您的免费使用期届满或您的应用程序使用超出免费使用范围时,您只需支付标准的即付即用服务费。

此后,它为每秒$ 0.0004。那是每分钟2.4美分或每小时1.44美元。

如果您超过免费套餐,那么节省的个人时间将是不值得的。