如何对 kaldi 生成的 xvector 使用 sklearn 逻辑回归

时间:2021-02-11 00:34:25

标签: python scikit-learn logistic-regression training-data kaldi

因此,来自 Python sklearn 库的逻辑回归具有 .fit() 函数,该函数以 x_train(features) 和 y_train(labels) 作为参数来训练分类器。

似乎x_train.shape = (number_of_samples, number_of_features)

对于 x_train,我应该使用提取的 xvector.scp 文件,我正在阅读该文件:

b = kaldiio.load_scp('xvector.scp')

我可以像这样打印内容:

for file_id in b:
  xvector = b[file_id]
  print(xvector)

它的问题是我必须逐行读取它,我不确定如何将 b 变量转换为数组以匹配 x_train.fit() 参数-功能。 xvector.scp 很大,大约有 100 万行。

有人知道我该怎么做吗?

0 个答案:

没有答案
相关问题