我已将cifar10-dataset中数据文件的数据附加到numpy数组中:
train_dataset=np.ndarray((50000,3072),dtype=np.float32)
train_labels=np.ndarray(50000,dtype=np.float32)
从培训文件到:
test_data=np.ndarray((10000,3072),dtype=np.float32)
test_labels=np.ndarray(10000,dtype=np.float32
sample_size = 1000
regr = LogisticRegression()
X_train = train_dataset[:sample_size]
y_train = train_labels[:sample_size]
%time regr.fit(X_train, y_train)
regr.score(test_data_final, test_labels_final)
我得到以下输出:
CPU times: user 19.8 s, sys: 0 ns, total: 19.8 s
Wall time: 20.2 s
Out[11]:
0.24940000000000001
这是在数据上运行逻辑回归的正确方法吗? 或者我应该重塑数据,因为每个数组由(R-G-B)32 * 32 * 32图像的3072(32 * 32 * 3)值组成?