Question

Google Cloud Speech API希望您将sync recognition mode用于运行时间不到一分钟的音频文件，如果音频文件超过一分钟则使用async recognition mode。

如果我们根据音频文件大小进行分析，如何分析用于获取成绩单的界面？或者如何找到音频durig转录的总时间或如何处理这种情况？

Answer 1

音频文件大小与确定音频持续时间无关，因为音频文件由多个音频样本组成（此样本总数取决于每秒采集的音频样本数，以赫兹为单位），每个样本具有给定的大小（编码样本需要多少位）。

您可以在此处找到sox实用程序及其soxi程序，以确定音频文件的持续时间。 soxi将解析音频文件的标题以提供该信息。以下是WAV文件的示例：

$ soxi audiofile.wav

Input File     : 'audiofile.wav'
Channels       : 2
Sample Rate    : 48000
Precision      : 16-bit
Duration       : 00:00:59.76 = 2868480 samples ~ 4482 CDDA sectors
File Size      : 11.5M
Bit Rate       : 1.54M
Sample Encoding: 16-bit Signed Integer PCM

这有帮助！

Google Cloud语音API中的转录文件大小

1 个答案: