Google Cloud语音API中的转录文件大小

时间:2018-02-09 05:49:56

标签: java audio google-cloud-platform speech-recognition google-speech-api

Google Cloud Speech API希望您将sync recognition mode用于运行时间不到一分钟的音频文件,如果音频文件超过一分钟则使用async recognition mode

如果我们根据音频文件大小进行分析,如何分析用于获取成绩单的界面?或者如何找到音频durig转录的总时间或如何处理这种情况?

1 个答案:

答案 0 :(得分:1)

音频文件大小与确定音频持续时间无关,因为音频文件由多个音频样本组成(此样本总数取决于每秒采集的音频样本数,以赫兹为单位),每个样本具有给定的大小(编码样本需要多少位)。

您可以在此处找到sox实用程序及其soxi程序,以确定音频文件的持续时间。 soxi将解析音频文件的标题以提供该信息。以下是WAV文件的示例:

$ soxi audiofile.wav

Input File     : 'audiofile.wav'
Channels       : 2
Sample Rate    : 48000
Precision      : 16-bit
Duration       : 00:00:59.76 = 2868480 samples ~ 4482 CDDA sectors
File Size      : 11.5M
Bit Rate       : 1.54M
Sample Encoding: 16-bit Signed Integer PCM

这有帮助!