我想为聋人写一个网络应用程序,允许他们打电话来打电话。目标是允许聋人在网页中输入电话号码,发起电话呼叫,将接收端的语音实时转录为文本,并将响应端的文本实时转换为语音。
我计划使用Twilio进行呼叫,捕获音频流,使用语音识别API转录语音,并使用Twilio的文本转语音功能转换文本。
我知道Twilio没有能力进行实时转录,我似乎找不到通过twilio.connection对象访问音频流的方法。因此,我正在考虑使用Media Capture API来捕获该语音。那可能吗?
答案 0 :(得分:0)
是的,这是可能的。但可能存在一些浏览器依赖性。 Simple示例可在此处找到。代码就是这样的。
var constraints = {
video: true,
audio: true,
};
if(navigator.mediaDevices.getUserMedia) {
navigator.mediaDevices.getUserMedia(constraints).then(getUserMediaSuccess).catch(errorHandler);
} else {
alert('Your browser does not support getUserMedia API');
}
答案 1 :(得分:0)
可通过Twilio Device api访问
lens