像scikit-learn(python)中的手写数字示例的符号识别

时间:2012-12-20 14:08:43

标签: multidimensional-array numpy python-2.7 machine-learning scikit-learn

我注意到这个例子:http://scikit-learn.org/stable/auto_examples/plot_digits_classification.html#example-plot-digits-classification-py 在scikit-learn python库中的手写数字。

我想准备一个3d数组(N * a * b),其中N是我的图像编号(75),而a * b是图像的矩阵(如例子中的8x8形状)。 我的问题是:每个图像都有不同形状的标志:(202,230),(250,322)..然后给我 此错误: ValueError:此代码中的数组维度必须达成共识,但d_0 除外:

#here there is the error:
grigiume = np.dstack(listagrigie)
print(grigiume.shape)
grigiume=np.rollaxis(grigiume,-1)
print(grigiume.shape)

有一种方法可以调整标准尺寸(即200x200)的所有图像,或者使用矩阵(a,b)的3d数组,其中a =来自b,并且不会在此代码中给出错误:

data = digits.images.reshape((n_samples, -1))
classifier.fit(data[:n_samples / 2], digits.target[:n_samples / 2])

我的代码:

import os
import glob
import numpy as np
from numpy import array
listagrigie = []

path = 'resize2/'
for infile in glob.glob( os.path.join(path, '*.jpg') ):
    print("current file is: " + infile )
    colorato = cv2.imread(infile)
    grigiscala = cv2.cvtColor(colorato,cv2.COLOR_BGR2GRAY)
    listagrigie.append(grigiscala)

print(len(listagrigie))

#here there is the error:
grigiume = np.dstack(listagrigie)
print(grigiume.shape)
grigiume=np.rollaxis(grigiume,-1)
print(grigiume.shape)


#last step
n_samples = len(digits.images)
data = digits.images.reshape((n_samples, -1))

# Create a classifier: a support vector classifier
classifier = svm.SVC(gamma=0.001)

# We learn the digits on the first half of the digits
classifier.fit(data[:n_samples / 2], digits.target[:n_samples / 2])

# Now predict the value of the digit on the second half:
expected = digits.target[n_samples / 2:]
predicted = classifier.predict(data[n_samples / 2:])

print "Classification report for classifier %s:\n%s\n" % (
classifier, metrics.classification_report(expected, predicted))
print "Confusion matrix:\n%s" % metrics.confusion_matrix(expected, predicted)

for index, (image, prediction) in enumerate(
    zip(digits.images[n_samples / 2:], predicted)[:4]):
    pl.subplot(2, 4, index + 5)
    pl.axis('off')
    pl.imshow(image, cmap=pl.cm.gray_r, interpolation='nearest')
    pl.title('Prediction: %i' % prediction)

pl.show()

1 个答案:

答案 0 :(得分:1)

您必须将所有图像调整为固定大小。例如,使用Image类PIL或Pillow

from PIL import Image
image = Image.open("/path/to/input_image.jpeg")
image.thumbnail((200, 200), Image.ANTIALIAS)
image.save("/path/to/output_image.jpeg")

修改:以上操作无效,请改为resize

from PIL import Image
image = Image.open("/path/to/input_image.jpeg")
image = image.resize((200, 200), Image.ANTIALIAS)
image.save("/path/to/output_image.jpeg")

编辑2 :可能有一种方法可以保留纵横比,并用黑色像素填充其余部分,但我不知道如何在几个PIL调用中执行操作。您可以使用PIL.Image.thumbnail并使用numpy进行填充。