应用错误收集

AWS Lambda函数中的音频文件到文本的转换

时间：2019-01-17 07:00:09

标签： python amazon-web-services audio aws-lambda speech-to-text

我正在尝试使用Speech_regcognition python包将音频文件转换为文本。但是它仅适用于非常小的音频文件（假设10秒）。但是我必须转换一个超过60秒的音频文件。我知道我可以使用Google Speech API将音频文件转换为文本，但这是付费服务。我不想使用付费服务。因此，现在我计划将原始音频文件拆分为多个小音频文件。假设如果我有60秒的音频文件，我会将每个部分转换为10秒的音频文件。将音频文件上传到S3存储桶后，我将尝试在AWS Lambda服务中执行此操作。这样我就可以使用此speech_recognition免费服务，而无需使用Google API密钥（付费）。

我的问题：如果我使用此方法，它将在我在AWS Lambda服务中使用该方法时造成任何问题或Google服务可以识别吗？

注意：此音频文件到文本文件的转换AWS Lambda函数将执行超过数百万次。

1 个答案:

答案 0 :(得分：1)

我建议您使用Amazon Transcribe节省一些时间和麻烦。与您的AWS Lambda函数集成将很容易。

如果您担心costs，则有一个免费套餐：

每月60分钟，为期12个月

从您创建第一个转录请求之日起，您就可以使用Amazon Transcribe免费套餐12个月。当您的免费使用期届满或您的应用程序使用超出免费使用范围时，您只需支付标准的即付即用服务费。

此后，它为每秒$ 0.0004。那是每分钟2.4美分或每小时1.44美元。

如果您超过免费套餐，那么节省的个人时间将是不值得的。