我正在使用生成器来训练和预测我的数据分类。这是ImageDataGenerator
的示例from keras.preprocessing.image import ImageDataGenerator
batch_size = 16
train_datagen = ImageDataGenerator(
rescale=1./255,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True)
test_datagen = ImageDataGenerator(rescale=1./255)
train_generator = train_datagen.flow_from_directory(
'data/train', # this is the target directory
target_size=(150, 150),
batch_size=batch_size,
class_mode='binary')
validation_generator = test_datagen.flow_from_directory(
'data/validation',
target_size=(150, 150),
batch_size=batch_size,
class_mode='binary')
model.fit_generator(
train_generator,
steps_per_epoch=2000 // batch_size,
epochs=50,
validation_data=validation_generator,
validation_steps=800 // batch_size)
model.save_weights('first_try.h5') # always save your weights after training or during training
我的问题是当我使用fit_generator
时如何创建AUC and ROC?
答案 0 :(得分:2)
我认为在这种情况下,您最好的选择是将AUC定义为新指标。为此,您必须在tensorflow中定义度量(我假设您正在使用tensorflow后端)。
我以前尝试过的一种方法(但是,我不记得我为结果的正确性进行了测试)是这样的:
def as_keras_metric(method):
"""
This is taken from:
https://stackoverflow.com/questions/45947351/how-to-use-tensorflow-metrics-in-keras/50527423#50527423
"""
@functools.wraps(method)
def wrapper(*args, **kwargs):
""" Wrapper for turning tensorflow metrics into keras metrics """
value, update_op = method(*args, **kwargs)
tf.keras.backend.get_session().run(tf.local_variables_initializer())
with tf.control_dependencies([update_op]):
value = tf.identity(value)
return value
return wrapper
,然后在编译模型时定义指标:
model.compile(metrics=['accuracy', as_keras_metric(tf.metrics.auc)], optimizer='adam', loss='categorical_crossentropy')
尽管这会吐出一些数字,但我还没有找出它们是否正确。如果您能够对此进行测试,并且能够给出正确的结果,请告诉我,我很想找出答案。
解决此问题的第二种方法是使用callback class并至少定义on_epoch_end
函数,然后可以从那里调用sklearn
roc_auc_score
并打印或保存到日志。
但是,到目前为止,我发现您需要通过__init__
向其提供训练数据,因此对于生成器,您需要确保回调的生成器提供的数据与模型的拟合发生器。另一方面,对于验证生成器,可以使用self.validation_data
从回调类访问它,该回调类与提供给fit_generator
的相同。