我在使用sk_learns load_svmlight_files函数加载多个文件时遇到问题。根据文档,它能够加载列表中的多个文件(如果我理解正确的话),所有文件都在同一文件夹中,因此仅名称就足够了。但是,当我加载并打印数据时,它运行得非常好,但是仅加载了第一个文件。
请参阅下面的某些有效代码
from sklearn.externals import joblib
from joblib import Memory
l_files = ["labeledBowtrain.feat", "labeledBowtest.feat"]
mem = Memory("./anaconda3/pkgs/cache")
@mem.cache
def get_data():
data = load_svmlight_files(l_files)
return data[0], data[1]
X, y = get_data()
(print(X))
它应该有一个50000行的稀疏矩阵(因为2个文件每个都有25000行),但是只有25000行。
提前谢谢! :)