google-cloud-speech AAC编码的转录

时间:2017-12-13 00:26:39

标签: android ios aac google-cloud-speech transcription

向Google Speech API小组提出的问题/请求:Google Speech是否可以为AAC编码提供转录?

背景---我们正在开发一款可在iOS和Android平台上运行的移动应用。 AAC是这两个平台上唯一支持的编码。由于性能和成本原因,能够从Google获取AAC编码的转录非常重要。我们希望避免将AAC编码转换为Google支持的编码的步骤。

使用有损编码的目的是使用较小的音频文件 - 这对于有效使用存储,内存和带宽资源非常重要。由于AAC是iOS和Android上唯一可用的编码,因此如果Google语音支持AAC编码,它将非常有用。

参考:https://cloud.google.com/speech/docs/basics讨论了Google Speech API为其提供转录的所有编码。希望Google Speech团队将AAC编码添加到列表中。

摘要 - 我们需要将AAC编码发送到Google Speech API并获取此编码的转录。如果谷歌演讲团队中的任何人正在阅读这篇文章,我将非常感谢您的回复---演讲团队是否计划将AAC编码添加到cloud.google.com/speech/docs/basics中支持的编码列表中?

1 个答案:

答案 0 :(得分:0)

  

我们正在开发移动应用...

您的应用应使用API​​转录音频。 Android SDK可以将您的AAC数据解压缩为原始数字音频(PCM)。如果必须向API提供.wav,那么只需以WAVE格式为PCM制作一个44字节的标题。将所有内容(标题+ PCM数据)放入bytearray并提供给API。

AAC不是音频。必须解码压缩数学以恢复PCM(波)音频数据。您可能正在存储AAC "for efficient use of storage, memory..." 但该设备仍在播放该设备RAM中保存的(临时)大型Wave文件。