应用错误收集

我可以提出一些一般性的观点。我假设基于SIP的VOIP实际上无处不在（IMS，LTE，3GPP等）。

搜索时，您可能会发现VOIP有两个部分：

SIP （控制平面）
RTP （数据或有效负载平面=音频）

通常，有两种方法，一种来自对等世界，其中媒体流中的每个更改都传达给另一方，而REFER实际上出于任何目的进行呼叫转移。但这通常不是首选的处理方式。这是第二种方法，它隐藏了B方（称为方）方面的任何更改。这样的东西也用在 IMS 中（在现代GSM网络的后面）。诀窍是A方（呼叫方）实际上到达B方代理。就 SIP 而言，它是 B2BUA ，即背对背用户代理。顾名思义，它涵盖了被叫方网络中发生的所有魔术。

然后魔术实际上隐藏在 B2BUA 的后面，该B2BUA实际上充当中间的实体，因此可以操纵 SIP 和 RTP

因此，该实体实际上可以使用 MGW （媒体网关）分叉向“真正的” B方（人员/操作员）以及定向音频进行 ML / AI / 专家系统分析。此过程还包含适当的控制平面事件，例如启动分析过程附加，实际音频分叉（ RTP ）以及触发最终B方的 SIP INVITE 。分析结束后，便会通过带外消息发送给 SIP代理（装有SoftPhone的计算机/平板电脑）或与呼叫中心相连的某些 CRM 系统的某些“富”客户端系统。这样的消息应将分析结果告知B方。

所有魔力都隐藏在 B2BUA 内部，或者最终隐藏在 SIP应用服务器内部，这是各种服务的通用名称，例如呼叫分配到呼叫中心代理，语音邮件，IVR等。

如今，语音分析已在银行中用于呼叫者验证，情绪分析和许多“智能”音频处理。

在该域中，有一些开源和专有的SIP系统。它们趋于复杂。而且，与请求-响应系统（如HTTP）相比，其逻辑有很大不同。该呼叫是一个带有“会话”（呼叫〜呼叫ID）的有状态系统，所有内容都与此绑定。

希望这可以为您提供帮助。

您是否考虑过使用像Plivo这样的基于API的VOIP提供程序？

用例的实时流传输部分可能很困难，但是我敢打赌，您可以找到一个不错的解决方法。我曾经在那儿担任解决方案工程师，所以我对API非常熟悉。如有任何疑问，请随时告诉我。

提取音频并将其注入正在进行的VOIP通话

2 个答案: