我已经知道Keras中fit()和fit_generator()之间的区别。前者用于训练数据“足够小”以适合内存的情况,而后者则用于从驻留在磁盘上的文件生成数据,因为训练数据太大而无法加载到内存中。
处理大数据问题(另存为.hdf5)的另一种方法是使用keras HDF5Matrix如下导入训练数据:
from keras.utils.io_utils import HDF5Matrix
X_train = HDF5Matrix('input/file.hdf5', 'x')
y_train = HDF5Matrix('input/file.hdf5', 'y')
然后使用.fit()训练模型
model.fit(x = X_train, y = y_train)
在那种情况下,使用fit_generator而不是简单的.fit()函数会更有优势吗?
我在网上找到的唯一答案是:
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.RandomizedSearchCV.html
谢谢