我正在尝试使用pybrain输出rgb值。输入层采用rgb值数组,所有隐藏层都是线性模型。我本以期望网络输出rgb值。但是,该网络的输出结果是一个值的数组,它们不在0:255的范围内。 图像是公牛的25个不同的.jpg图像。每个图像都是一个长度为575280的扁平数组。我希望网络会聚合在一个最终类似于公牛的图像上。
import numpy as np
from pybrain.structure import FeedForwardNetwork, LinearLayer, SigmoidLayer, GaussianLayer, TanhLayer
from pybrain.structure import FullConnection, BiasUnit
import testabull
bull_x = 510
bull_y = 398
bull_flat = 575280
n = FeedForwardNetwork()
bias_unit = BiasUnit()
in_layer = LinearLayer(bull_flat)
hidden_A = LinearLayer(5)
hidden_B = LinearLayer(10)
out_layer = LinearLayer(bull_flat)
n.addInputModule(in_layer)
n.addModule(hidden_A)
n.addModule(hidden_B)
n.addOutputModule(out_layer)
n.addModule(bias_unit)
in_to_hidden = FullConnection(in_layer, hidden_A)
hidden_to_hidden = FullConnection(hidden_A, hidden_B)
hidden_to_out = FullConnection(hidden_B, out_layer)
bias_to_hidden = FullConnection(hidden_B, out_layer)
n.addConnection(in_to_hidden)
n.addConnection(hidden_to_hidden)
n.addConnection(bias_to_hidden)
n.addConnection(hidden_to_out)
n.sortModules()
bull_img_array = testabull.crop_the_bull_images('../../imgs/thebull/')
trainable_array = [] ## an array of flattened images
for im in bull_img_array:
flat_im = np.array(im).flatten()
trainable_array.append(flat_im)
print n
print n.activate(trainable_array[0])
output = None
for a in trainable_array:
output = n.activate(a)
print output, len(output)
如果有人有任何提示,我会非常感激。
答案 0 :(得分:1)
首先,这里有两个问题,一个是你需要在0到255之间缩放你的输出。你可以在之后进行一些转换。通过获取最大值和最小值,然后在0到255之间进行转置。
另一方面,此网络可能无法了解您的喜好,您的隐藏图层正在使用线性图层。这不是很有用,因为权重本身形成线性变换。你最终会得到一个线性函数。 ftp://ftp.sas.com/pub/neural/FAQ2.html#A_act
我建议使用SigmoidLayer作为隐藏图层,这当然会压缩介于0和1之间的值。您可以在输出图层中乘以255来更正此值。可以通过固定图层或者之后转换值。