Twilio语音抄写替换

时间:2012-07-13 15:08:56

标签: c# sms voice-recognition twilio

我希望使用Twilio

  1. 接听电话
  2. 转录声音
  3. 使用转录录制文本回复用户
  4. 我有这个很好的设置,但Twilio的抄录是一个奇怪的低质量。可能它无法理解我的约克郡口音(毕竟它是一家加利福尼亚公司),但有complaints from others可能更清晰的说话声音,这真的很糟糕。

    我知道我可以换掉他们自己的转录服务并使用第三方。我估计我可以抓取生成的mp3文件。所以我需要的是

    1. 可通过网络服务或类似方式调用的第三方转录服务
    2. 服务完成后会生成回调
    3. 该服务使用mp3文件
    4. 该服务实际上合理转录。它并不需要完美,因为文本将返回给用户进行更正,但它确实需要相当不错。
    5. 有没有人有过这样的经历?我并没有致力于Twilio - 我仍然在概念证明,所以一个完整的选择也会引起人们的兴趣。

      这看起来是否合理。我尝试过疯狂的活动吗?感谢您的回复。

      为了完整起见 - 我使用的是带有Razor引擎的MVC 3架构,但我并不认为它具有极大的相关性。

      非常感谢

2 个答案:

答案 0 :(得分:3)

以下是提供转录的两个(我所知道的唯一)API。两者都提供机器和人类转录,具体取决于您的需求:

VoiceCloud:您发布了音频文件(mp3 / wav)的链接,他们会在处理后将文本发送到回调网址。机器转录的转录费用为0.10美元/分钟,人工辅助转录费用为0.01美元/秒。我相信每月最低250.00美元仅适用于人类转录。

QuickTate:您通过XML-RPC提交音频文件或链接,QuickTate将通过回调URL发送完成的转录。您还可以检查工作状态以获得部分转录。价格取决于预付款,他们也提供医疗质量。每个单词的价格从0.01美元到0.025美元不等。

我已经使用过两者,如果您需要高质量的转录,我的建议将是QuickTate(虽然VoiceCloud仍然会超过Twilio原生转录的质量)。如果您有许多短文件,Quicktate可能会降低成本,因为VoiceCloud(当我使用它时)的最低费用为30秒。

答案 1 :(得分:0)

Google Voice!

发送mp3会有点棘手,因为你必须实时播放它,但谷歌语音自动转录声音邮件,我没有亲自听到任何负面评论他们的转录。

我最近刚刚对我的VoIP和语音邮件解决方案公司进行了审核,Google Voice是其中的重要组成部分。如果他们的转录有任何严重问题,我可能会在我的搜索中偶然发现它们。

您还可以设置Google Voice Lite帐户,该帐户只是语音邮件,而不是任何类型的电话附加帐户。