使用OpenCV或Matplotlib / Pyplot可视化MNIST数据集

时间:2016-05-14 15:18:32

标签: python opencv matplotlib machine-learning mnist

我有MNIST数据集,我正在尝试使用pyplot将其可视化。数据集采用cvs格式,其中每行是784像素的一个图像。我希望以{* 1}}或pyplot以28 * 28图片格式将其可视化。我正在尝试直接使用:

opencv

但我不工作?关于如何处理这个问题的任何想法。

3 个答案:

答案 0 :(得分:26)

假设您有一个具有此格式的CSV文件,这是一种格式,可以在

中找到MNIST数据集
label, pixel_1_1, pixel_1_2, ...

以下是如何使用Matplotlib然后使用OpenCV在Python中对其进行可视化

Matplotlib / Pyplot

import numpy as np
import csv
import matplotlib.pyplot as plt

with open('mnist_test_10.csv', 'r') as csv_file:
    for data in csv.reader(csv_file):
        # The first column is the label
        label = data[0]

        # The rest of columns are pixels
        pixels = data[1:]

        # Make those columns into a array of 8-bits pixels
        # This array will be of 1D with length 784
        # The pixel intensity values are integers from 0 to 255
        pixels = np.array(pixels, dtype='uint8')

        # Reshape the array into 28 x 28 array (2-dimensional array)
        pixels = pixels.reshape((28, 28))

        # Plot
        plt.title('Label is {label}'.format(label=label))
        plt.imshow(pixels, cmap='gray')
        plt.show()

        break # This stops the loop, I just want to see one

enter image description here

的OpenCV

你可以从上面取pixels numpy数组dtype='uint8'(无符号8位整数)和28 x 28形状,并用cv2.imshow()

绘图
    title = 'Label is {label}'.format(label=label)

    cv2.imshow(title, pixels)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

答案 1 :(得分:4)

对于像我这样想要快速而肮脏的解决方案的人,只需粗略了解给定输入的内容,控制台内部以及没有花哨的库:

def print_greyscale(pixels, width=28, height=28):
    def get_single_greyscale(pixel):
        val = 232 + round(pixel * 23)
        return '\x1b[48;5;{}m \x1b[0m'.format(int(val))

    for l in range(height):
        line_pixels = pixels[l * width:(l+1) * width]
        print(''.join(get_single_greyscale(p) for p in line_pixels))

(期望输入的形状类似于[784]并且浮点值从0到1.如果不是这种情况,您可以轻松转换(例如pixels = pixels.reshape((784,))pixels \= 255

Output

输出有点失真,但你明白了。

答案 2 :(得分:0)

导入必要的软件包

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

将mnist火车数据集(csv格式)读取为熊猫数据框

s = pd.read_csv("mnist_train.csv")

将熊猫数据帧转换为numpy矩阵

data = np.matrix(s)

第一列包含标签,因此请将其存储在单独的数组中

output = data[:, 0]

然后从数据矩阵中删除第一列

data = np.delete(data, 0, 1)

第一行代表第一张图像,它是28X28图像(存储为784像素)

img = data[0].reshape(28,28)

[And displaying the image][1]
plt.imshow(img, cmap="gray")

enter image description here