python - 如何对 kaldi 生成的 xvector 使用 sklearn 逻辑回归

因此，来自 Python sklearn 库的逻辑回归具有 .fit() 函数，该函数以 x_train(features) 和 y_train(labels) 作为参数来训练分类器。

似乎x_train.shape = (number_of_samples, number_of_features)

对于 x_train，我应该使用提取的 xvector.scp 文件，我正在阅读该文件：

b = kaldiio.load_scp('xvector.scp')

我可以像这样打印内容：

for file_id in b:
  xvector = b[file_id]
  print(xvector)

它的问题是我必须逐行读取它，我不确定如何将 b 变量转换为数组以匹配 x_train 的 .fit() 参数-功能。 xvector.scp 很大，大约有 100 万行。

有人知道我该怎么做吗？