应用错误收集

语音转录：窄带还是宽带？

时间：2017-01-11 07:38:35

标签： javascript ibm-watson

使用IBM Watson，他们可以选择进行说话人识别（第1人，第2人）等。

这仅适用于窄带模型。这样做会很酷，但不能以准确的成绩单为代价。选择窄带模型会降低精度吗？我正在录制电影对话框。

1 个答案:

答案 0 :(得分：-1)

如果您想要说话人识别，那么Narrowband是您目前唯一的选择。

documentation says：

扬声器标签功能目前是测试版功能适用于美国英语，西班牙语和日语窄带模型仅

对我来说这听起来像将来可能会推广到宽带型号。如果发生这种情况，宽带模型将更适合电影对话。

我不希望窄带显着降低准确度;对它的主要打击是它需要更多的工作（通过Watson服务）来产生相同质量的结果。

您可以尝试双向转录剪辑（不使用speaker_labels）并比较结果，以便了解精确度是否有所不同。