使用Speech to Text的mp3文件的MIME类型

时间:2017-05-16 11:15:32

标签: node.js speech-to-text ibm-watson watson

我正在使用Watson的文本API语音。最初我使用.wav文件,但我想使用mp3文件。所以我想知道用于指定内容类型的mp3文件的MIME类型吗?

1 个答案:

答案 0 :(得分:1)

您可以在official documentation内看到音频格式支持:

  • 音频格式:转录免费无损音频编解码器( FLAC ),线性16位脉冲编码调制( PCM ),波形音频文件格式( WAV ),带有Opus或Vorbis编解码器的Ogg格式,带有Opus或Vorbis编解码器的网络媒体( WebM )格式,mu-law(或u-law) )音频数据或基本音频。

检查:MIME Types语音到文字。

使用mp3音频的一个好主意是在发送API之前进行转换。

而且,取决于您的需求,您可以使用this文章。在本文中,Jason展示了如何使用带Asterisk的mp3将Speech语音音频发送到Text。我不确定是否有效。

编辑: [10/2017]

几天前,Watson Speech to Text发布了一个支持 mp3 输入功能的新版本。

检查现在支持的音频格式:

音频格式:转录免费无损音频编解码器(FLAC), MP3(运动图像专家组或MPEG)格式,线性16位脉冲编码调制( PCM),波形音频文件格式(WAV),带有Opus或Vorbis编解码器的Ogg格式,带有Opus或Vorbis编解码器的Web媒体(WebM)格式,mu-law(或u-law)音频数据和基本音频。< / p>