我有一套相当强大的工作流程,我使用Node Red与Watson工具集的各个部分进行交互。我想通过Twilio为他们创建一个语音通过电话的界面,但我很难弄清楚我需要做什么才能访问实时音频源。
通过Node-Red,Watson STT需要什么:
Speech To Text将人声转换为书面文字。该服务使用机器智能将有关语法和语言结构的信息与音频信号的组成知识相结合,以生成更准确的转录
要分析的音频文件应该在msg.payload上传递。
支持的msg.payload类型:。
音频的字符串URL 缓冲原始音频字节 音频必须是WAV,FLAC或OGG编码文件。
问题是这样的:我已经搜索了可编程语音的API,但似乎没有成功找到我要创建音频流的API调用(参考'经过可以通过管道传输到Watson STT的URL或音频字节。
任何使用Twilio工具集比我更有经验的人都有一些答案吗?