我正在尝试训练前馈神经网络,用于二进制分类。我的数据集是6.2M,维度为1.5M。我正在使用PyBrain。我甚至无法加载一个数据点。我得到了MemoryError。
我的代码段是:
Train_ds = SupervisedDataSet(FV_length, 1) #FV_length is a computed value. 150000
feature_vector = numpy.zeros((FV_length),dtype=numpy.int)
#activate feature values
for index in nonzero_index_list:
feature_vector[index] = 1
Train_ds.addSample(feature_vector,class_label) # both the arguments are tuples
答案 0 :(得分:1)
您的计算机似乎没有内存可以将您的功能和类标签数组添加到受监控的数据集Train_ds。
如果您无法为系统分配更多内存,那么从您的数据集中随机抽样并在较小的样本上进行训练可能是个好主意。
如果样本足够大,可以提供准确的结果。