提取音频并将其注入正在进行的VOIP通话

时间:2019-01-29 00:56:42

标签: voip audio-streaming pbx

在VOIP以及与VOIP系统集成方面,我是一个新手。

这就是我想要做的:

  1. 呼叫者打进来,话务员接听电话。
    1.1。开始将呼叫者的音频流传输到云中的分析服务。
  2. 执行音频分析后(通常在几秒钟内),操作员将按下“保持”按钮以执行分析建议的操作。
    2.1。根据分析结果,将特定的音频文件播放回给呼叫者,让他们知道操作员在保持状态下正在执行“ x”,“ y”或“ z”。

鉴于我对VOIP系统的使用经验不足,我正在寻找有关主题,领域,文章,技术的任何建议/指针,这些都可以为我指明正确的方向。

2 个答案:

答案 0 :(得分:1)

我可以提出一些一般性的观点。我假设基于SIP的VOIP实际上无处不在(IMS,LTE,3GPP等)。

搜索时,您可能会发现VOIP有两个部分:

  • SIP (控制平面)
  • RTP (数据或有效负载平面=音频)

通常,有两种方法,一种来自对等世界,其中媒体流中的每个更改都传达给另一方,而REFER实际上出于任何目的进行呼叫转移。但这通常不是首选的处理方式。这是第二种方法,它隐藏了B方(称为方)方面的任何更改。这样的东西也用在 IMS 中(在现代GSM网络的后面)。诀窍是A方(呼叫方)实际上到达B方代理。就 SIP 而言,它是 B2BUA ,即背对背用户代理。顾名思义,它涵盖了被叫方网络中发生的所有魔术。

然后魔术实际上隐藏在 B2BUA 的后面,该B2BUA实际上充当中间的实体,因此可以操纵 SIP RTP

因此,该实体实际上可以使用 MGW (媒体网关)分叉向“真正的” B方(人员/操作员)以及定向音频进行 ML / AI / 专家系统分析。此过程还包含适当的控制平面事件,例如启动分析过程附加,实际音频分叉( RTP )以及触发最终B方的 SIP INVITE 。分析结束后,便会通过带外消息发送给 SIP代理(装有SoftPhone的计算机/平板电脑)或与呼叫中心相连的某些 CRM 系统的某些“富”客户端系统。这样的消息应将分析结果告知B方。

所有魔力都隐藏在 B2BUA 内部,或者最终隐藏在 SIP应用服务器内部,这是各种服务的通用名称,例如呼叫分配到呼叫中心代理,语音邮件,IVR等。

如今,语音分析已在银行中用于呼叫者验证,情绪分析和许多“智能”音频处理。

在该域中,有一些开源和专有的SIP系统。它们趋于复杂。而且,与请求-响应系统(如HTTP)相比,其逻辑有很大不同。该呼叫是一个带有“会话”(呼叫〜呼叫ID)的有状态系统,所有内容都与此绑定。

希望这可以为您提供帮助。

答案 1 :(得分:0)

您是否考虑过使用像Plivo这样的基于API的VOIP提供程序?

用例的实时流传输部分可能很困难,但是我敢打赌,您可以找到一个不错的解决方法。我曾经在那儿担任解决方案工程师,所以我对API非常熟悉。如有任何疑问,请随时告诉我。