使用load_svmlight_files和sklearn加载多个文件-问题

时间:2019-06-04 07:30:02

标签: python scikit-learn joblib svmlight

我在使用sk_learns load_svmlight_files函数加载多个文件时遇到问题。根据文档,它能够加载列表中的多个文件(如果我理解正确的话),所有文件都在同一文件夹中,因此仅名称就足够了。但是,当我加载并打印数据时,它运行得非常好,但是仅加载了第一个文件。

请参阅下面的某些有效代码

from sklearn.externals import joblib
from joblib import Memory

l_files = ["labeledBowtrain.feat", "labeledBowtest.feat"]
mem = Memory("./anaconda3/pkgs/cache")

@mem.cache
def get_data():
    data = load_svmlight_files(l_files)
    return data[0], data[1]

X, y = get_data()

(print(X))

它应该有一个50000行的稀疏矩阵(因为2个文件每个都有25000行),但是只有25000行。

提前谢谢! :)

0 个答案:

没有答案