语音转录:窄带还是宽带?

时间:2017-01-11 07:38:35

标签: javascript ibm-watson

使用IBM Watson,他们可以选择进行说话人识别(第1人,第2人)等。

这仅适用于窄带模型。这样做会很酷,但不能以准确的成绩单为代价。选择窄带模型会降低精度吗?我正在录制电影对话框。

1 个答案:

答案 0 :(得分:-1)

如果您想要说话人识别,那么Narrowband是您目前唯一的选择。

documentation says

  

扬声器标签功能目前是测试版功能   适用于美国英语,西班牙语和日语窄带模型   仅

对我来说这听起来像将来可能会推广到宽带型号。如果发生这种情况,宽带模型将更适合电影对话。

我不希望窄带显着降低准确度;对它的主要打击是它需要更多的工作(通过Watson服务)来产生相同质量的结果。

您可以尝试双向转录剪辑(不使用speaker_labels)并比较结果,以便了解精确度是否有所不同。