应用错误收集

我有超过100小时的音频与视频采访相关联，需要转录为文本的纪录片 - 希望每隔30秒左右使用某种时间码标记，以便视频可轻松匹配到编辑套件中的文字。

文件是BWAV 24位96khz和WAV 16位48khz，持续20分钟到2小时。

在VM中需要设置哪些资源才能执行此类活动？我怀疑它将是计算密集型的，因此VM可能需要32个内核和相当数量的内存，但是不需要实时响应，因此如果优先级很低并且处理文件需要几个小时就可以了。我的预算微不足道 - 300美元是我们能够负担得起的所有文件（这是我们不能以75美元/小时的速度将这些文件发送到转录服务的一个原因）。

我已经拥有云平台帐户但从未使用过它。如果某人已经做过类似事情并且可以给我一些帮助，我的挣扎就没有意义了。

设置Google Cloud Speech API以转录采访

0 个答案: