我有简单的seq2seq模型:
import seq2seq
import numpy as np
import keras.backend as K
from seq2seq.models import Seq2Seq
from keras.models import Model
from keras.models import Sequential
from keras.layers import Embedding, Input, TimeDistributed, Activation
BLOCK_LEN = 60
EVENTS_CNT = 462
input = Input((BLOCK_LEN,))
embedded = Embedding(input_dim=EVENTS_CNT+1, output_dim=200)(input)
emb_model = Model(input, embedded)
seq_model = Seq2Seq(batch_input_shape=(None, BLOCK_LEN, 200), hidden_dim=200, output_length=BLOCK_LEN, output_dim=EVENTS_CNT)
model = Sequential()
model.add(emb_model)
model.add(seq_model)
model.add(TimeDistributed(Activation('softmax')))
model.summary()
_________________________________________________________________
Layer (type) Output Shape Param #
=================================================================
model_1 (Model) (None, 60, 200) 92600
_________________________________________________________________
model_12 (Model) (None, 60, 462) 1077124
_________________________________________________________________
time_distributed_2 (TimeDist (None, 60, 462) 0
=================================================================
Total params: 1,169,724
Trainable params: 1,169,724
Non-trainable params: 0
_________________________________________________________________
我正在尝试创建自己的指标:
def symbol_acc(true, predicted):
np_y_true = K.get_value(true)
np_y_pred = K.get_value(predicted)
return K.mean(np_y_true == np_y_pred)
如果我尝试使用此指标编译模型,我会收到错误"您必须为占位符张量提供一个值"以下消息:
InvalidArgumentError Traceback (most recent call last)
C:\Users\Anna\Anaconda3\lib\site-packages\tensorflow\python\client\session.py in _do_call(self, fn, *args)
1322 try:
-> 1323 return fn(*args)
1324 except errors.OpError as e:
C:\Users\Anna\Anaconda3\lib\site-packages\tensorflow\python\client\session.py in _run_fn(session, feed_dict, fetch_list, target_list, options, run_metadata)
1301 feed_dict, fetch_list, target_list,
-> 1302 status, run_metadata)
1303
C:\Users\Anna\Anaconda3\lib\site-packages\tensorflow\python\framework\errors_impl.py in __exit__(self, type_arg, value_arg, traceback_arg)
472 compat.as_text(c_api.TF_Message(self.status.status)),
--> 473 c_api.TF_GetCode(self.status.status))
474 # Delete the underlying status object from memory otherwise it stays alive
InvalidArgumentError: You must feed a value for placeholder tensor 'time_distributed_2_target' with dtype float and shape [?,?,?]
[[Node: time_distributed_2_target = Placeholder[dtype=DT_FLOAT, shape=[?,?,?], _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
但是下面的代码工作正常(不会产生任何异常):
def symbol_acc2(true, predicted):
true = np.array(true)
predicted = np.array(predicted)
return K.variable((true == predicted).mean())
你能解释一下这个例外是什么意思吗?我认为symbol_acc
和symbol_acc2
正在做同样的事情。我是NN和keras的新手,所以也许我没有看到一些明显的东西。我在stackoverflow上看到了类似的问题,但没有找到适合我情况的答案。
答案 0 :(得分:5)
指标,损失和整个模型都是象征性的"张量。
这意味着,在您开始拟合或预测之前,它们绝对没有数据(或值)。
当您致电K.get_value
时,您正试图获取一个不存在的值。 (只有在您将数据提供给模型时才会存在。它所谓的占位符是一个空输入张量,期望在拟合或预测时接收数据)。
问题的解决方案根本就是不尝试获取值。 (numpy版本也不起作用,编译此函数时值不存在。)
您必须将所有操作保持为符号,并在提供数据时执行这些操作。
所以:
def symbol_acc(true, predicted):
isEqual = K.cast(K.equal(true,predicted),K.floatx())
return K.mean(isEqual)
答案 1 :(得分:3)
在symbol_acc
中,非工作版本tf.keras.backend.get_value()
(代码中为K.get_value()
)将获取变量值作为Numpy数组。然后,这一行K.mean(np_y_true == np_y_pred)
首先根据相等性创建另一个(boolean) Numpy array,tf.keras.backend.mean()
尝试将Numpy数组视为张量,并且它不会以这种方式工作。
显示错误是因为在图表创建时true
尚无值,尚未投放。
symbol_acc2
不会引发错误,但也不会发生错误,因为在图表创建时true
和predicted
只是空张量。 Numpy不会改变这种情况,但是比较会失败,取平均值会产生零,而你只是创建一个零值的变量。考虑这段代码(已测试):
import keras.backend as K
import numpy as np
true = K.placeholder( ( 2, ) )
predicted = K.placeholder( ( 2, ) )
a = np.array( true )
b = np.array( predicted )
c = a == b
print( c, c.mean() )
输出:
(False,0.0)
无论数据是什么(目前还没有张量中的数据。)
为了达到你想要的效果,即计算预测的准确性,你可以简单地使用
def symbol_acc( true, predicted ):
return K.mean( K.cast_to_floatx( K.equal( true, predicted ) ) )
或者你可以让自己的生活变得更轻松,并且看看Keras'拥有categorical_accuracy
指标。