我正在编写一个Python程序来检测国际象棋棋盘的状态,我正在使用一个滑动窗口来检测每个棋子的位置。我的主程序检测到图像中的棋盘,并将其裁剪的图片传递给my_sliding_window方法。这应该使用Tensorflow来检测滑动窗口中的一块。从this教程我看到图片的内容如下:
image_data = tf.gfile.FastGFile('picture.jpg', 'rb').read()
但是我不想从文件中读取它,因为我已经将图片放在一个numpy数组中。如何通过Tensorflow对我的numpy数组进行分类?
谢谢。
代码:
import tensorflow as tf, sys
import cv2
image_path = sys.argv[1]
img = cv2.imread('picture.jpg')
image_data = tf.convert_to_tensor(img)
print type(image_data) # this returns <class 'tensorflow.python.framework.ops.Tensor'>
# This is what is used in the tutorial I mentioned above
image_data2 = tf.gfile.FastGFile(image_path, 'rb').read()
print type(image_data2) # this returns <type 'str'>
# Loads label file, strips off carriage return
label_lines = [line.rstrip() for line
in tf.gfile.GFile("retrained_labels.txt")]
# Unpersists graph from file
with tf.gfile.FastGFile("retrained_graph.pb", 'rb') as f:
graph_def = tf.GraphDef()
graph_def.ParseFromString(f.read())
_ = tf.import_graph_def(graph_def, name='')
with tf.Session() as sess:
# Feed the image_data as input to the graph and get first prediction
softmax_tensor = sess.graph.get_tensor_by_name('final_result:0')
predictions = sess.run(softmax_tensor, \
{'DecodeJpeg/contents:0': image_data})
# Sort to show labels of first prediction in order of confidence
top_k = predictions[0].argsort()[-len(predictions[0]):][::-1]
for node_id in top_k:
human_string = label_lines[node_id]
score = predictions[0][node_id]
print('%s (score = %.5f)' % (human_string, score))
答案 0 :(得分:1)
您可以使用tf.convert_to_tensor()
将numpy数组转换为TensorFlow张量:
此函数将各种类型的Python对象转换为Tensor对象。它接受Tensor对象,numpy数组,Python列表和Python标量。
好的,您尝试做的是将带有维度$scope.revealNumbers
的numpy数组image_data
提供给占位符[123, 82]
。但是,该占位符定义为DecodeJpeg/contents:0
,这意味着它只接受0D张量作为输入(请参阅tensor shapes),因此会给您一个错误。
original code所做的是将图像作为无量纲字符串读取:
shape=()
然后将输入到image_data = tf.gfile.FastGFile(image_path, 'rb').read()
占位符:
DecodeJpeg/contents:0
通过预训练图表继续尝试运行图像的最简单方法是使用相同的predictions = sess.run(softmax_tensor, {'DecodeJpeg/contents:0': image_data})
调用来加载图像。
答案 1 :(得分:0)
我通过使用这种单线解决了这个问题:
image_data = cv2.imencode('.jpg', cv_image)[1].tostring()