使用IBM Watson,他们可以选择进行说话人识别(第1人,第2人)等。
这仅适用于窄带模型。这样做会很酷,但不能以准确的成绩单为代价。选择窄带模型会降低精度吗?我正在录制电影对话框。
答案 0 :(得分:-1)
如果您想要说话人识别,那么Narrowband是您目前唯一的选择。
扬声器标签功能目前是测试版功能 适用于美国英语,西班牙语和日语窄带模型 仅
对我来说这听起来像将来可能会推广到宽带型号。如果发生这种情况,宽带模型将更适合电影对话。
我不希望窄带显着降低准确度;对它的主要打击是它需要更多的工作(通过Watson服务)来产生相同质量的结果。
您可以尝试双向转录剪辑(不使用speaker_labels)并比较结果,以便了解精确度是否有所不同。