我正在使用Watson的文本API语音。最初我使用.wav文件,但我想使用mp3文件。所以我想知道用于指定内容类型的mp3文件的MIME类型吗?
答案 0 :(得分:1)
您可以在official documentation内看到音频格式支持:
检查:MIME Types语音到文字。
使用mp3音频的一个好主意是在发送API之前进行转换。
而且,取决于您的需求,您可以使用this文章。在本文中,Jason展示了如何使用带Asterisk的mp3将Speech语音音频发送到Text。我不确定是否有效。
编辑: [10/2017]
几天前,Watson Speech to Text发布了一个支持 mp3 输入功能的新版本。
检查现在支持的音频格式:
音频格式:转录免费无损音频编解码器(FLAC), MP3(运动图像专家组或MPEG)格式,线性16位脉冲编码调制( PCM),波形音频文件格式(WAV),带有Opus或Vorbis编解码器的Ogg格式,带有Opus或Vorbis编解码器的Web媒体(WebM)格式,mu-law(或u-law)音频数据和基本音频。< / p>