使用fit_generator和valuate_generator训练网络时,如何绘制AUC和ROC?

时间:2018-11-30 04:46:59

标签: python tensorflow scikit-learn keras

我正在使用生成器来训练和预测我的数据分类。这是ImageDataGenerator

的示例
from keras.preprocessing.image import ImageDataGenerator

batch_size = 16

train_datagen = ImageDataGenerator(
        rescale=1./255,
        shear_range=0.2,
        zoom_range=0.2,
        horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1./255)


train_generator = train_datagen.flow_from_directory(
        'data/train',  # this is the target directory
        target_size=(150, 150),  
        batch_size=batch_size,
        class_mode='binary') 

validation_generator = test_datagen.flow_from_directory(
        'data/validation',
        target_size=(150, 150),
        batch_size=batch_size,
        class_mode='binary')


model.fit_generator(
        train_generator,
        steps_per_epoch=2000 // batch_size,
        epochs=50,
        validation_data=validation_generator,
        validation_steps=800 // batch_size)
model.save_weights('first_try.h5')  # always save your weights after training or during training

我的问题是当我使用fit_generator时如何创建AUC and ROC

1 个答案:

答案 0 :(得分:2)

我认为在这种情况下,您最好的选择是将AUC定义为新指标。为此,您必须在tensorflow中定义度量(我假设您正在使用tensorflow后端)。

我以前尝试过的一种方法(但是,我不记得我为结果的正确性进行了测试)是这样的:

def as_keras_metric(method):
    """
    This is taken from:
    https://stackoverflow.com/questions/45947351/how-to-use-tensorflow-metrics-in-keras/50527423#50527423
    """
    @functools.wraps(method)
    def wrapper(*args, **kwargs):
        """ Wrapper for turning tensorflow metrics into keras metrics """
        value, update_op = method(*args, **kwargs)
        tf.keras.backend.get_session().run(tf.local_variables_initializer())
        with tf.control_dependencies([update_op]):
            value = tf.identity(value)
        return value
    return wrapper

,然后在编译模型时定义指标:

model.compile(metrics=['accuracy', as_keras_metric(tf.metrics.auc)], optimizer='adam', loss='categorical_crossentropy')

尽管这会吐出一些数字,但我还没有找出它们是否正确。如果您能够对此进行测试,并且能够给出正确的结果,请告诉我,我很想找出答案。

解决此问题的第二种方法是使用callback class并至少定义on_epoch_end函数,然后可以从那里调用sklearn roc_auc_score并打印或保存到日志。

但是,到目前为止,我发现您需要通过__init__向其提供训练数据,因此对于生成器,您需要确保回调的生成器提供的数据与模型的拟合发生器。另一方面,对于验证生成器,可以使用self.validation_data从回调类访问它,该回调类与提供给fit_generator的相同。