Google Cloud Speech API希望您将sync recognition mode用于运行时间不到一分钟的音频文件,如果音频文件超过一分钟则使用async recognition mode。
如果我们根据音频文件大小进行分析,如何分析用于获取成绩单的界面?或者如何找到音频durig转录的总时间或如何处理这种情况?
答案 0 :(得分:1)
音频文件大小与确定音频持续时间无关,因为音频文件由多个音频样本组成(此样本总数取决于每秒采集的音频样本数,以赫兹为单位),每个样本具有给定的大小(编码样本需要多少位)。
您可以在此处找到sox实用程序及其soxi
程序,以确定音频文件的持续时间。 soxi
将解析音频文件的标题以提供该信息。以下是WAV文件的示例:
$ soxi audiofile.wav
Input File : 'audiofile.wav'
Channels : 2
Sample Rate : 48000
Precision : 16-bit
Duration : 00:00:59.76 = 2868480 samples ~ 4482 CDDA sectors
File Size : 11.5M
Bit Rate : 1.54M
Sample Encoding: 16-bit Signed Integer PCM
这有帮助!