标签: artificial-intelligence voice-recognition
我正在尝试遵循this tutorial来使用SideKit工具箱对说话人识别进行训练并对i-vector / PLDA系统进行评分。
系统使用数据的4个子集:注册,测试,电视和plda。
电视子集用于计算总变异性矩阵,然后用于从其余子集中的每个子集计算i矢量
plda i向量用于计分时用于注册和测试i向量的过滤器。
此外,我假设有一些背景样本以及想要注册并随后得分的样本。
我应如何确定电视和plda子集的内容?所有子集都应该独立(彼此之间没有重叠)吗?