我有一个数据集,具有我想扩展的功能,带有张量流。问题是我不了解将转换应用于输入集,然后再应用于随机输入向量(用于单个预测)的机制是什么。
什么是用于标准化数据集的最佳实践模式,以便可以保留均值和标准差以备后用?换句话说,在训练模型时,如何在训练和测试时有效地应用所定义的预处理方法?
编辑:我认为它可能会出现类似的情况
init_dataset = [[1,2,3],[4,5,6],[7,8,9]]
init_dataset_normalized = normalize(init_data_set)
fit = model( init_dataset_normalized )
pred = fit.predict( normalize( random_input ))
答案 0 :(得分:1)
假设我有灰度图像,我使用以下图像:
def scale(X):
x = []
for i in range(len(X)):
x.append(X[i].astype('float32'))
x[i] /= 255.0
return x
希望这可以回答问题。