设置Google Cloud Speech API以转录采访

时间:2016-08-27 06:24:01

标签: speech-to-text transcription google-cloud-speech

我有超过100小时的音频与视频采访相关联,需要转录为文本的纪录片 - 希望每隔30秒左右使用某种时间码标记,以便视频可轻松匹配到编辑套件中的文字。

文件是BWAV 24位96khz和WAV 16位48khz,持续20分钟到2小时。

在VM中需要设置哪些资源才能执行此类活动?我怀疑它将是计算密集型的,因此VM可能需要32个内核和相当数量的内存,但是不需要实时响应,因此如果优先级很低并且处理文件需要几个小时就可以了。我的预算微不足道 - 300美元是我们能够负担得起的所有文件(这是我们不能以75美元/小时的速度将这些文件发送到转录服务的一个原因)。

我已经拥有云平台帐户但从未使用过它。如果某人已经做过类似事情并且可以给我一些帮助,我的挣扎就没有意义了。

0 个答案:

没有答案