标签: machine-learning io google-cloud-storage google-cloud-ml
我想使用Keras在40 GB图像的数据集上训练模型,并且我试图尽可能高效地读取这些图像。
在本地下载它们不是一种选择。 Tensorflow的file_io.FileIO()是立即读取还是以某种方式缓存其结果?
file_io.FileIO()
有替代品吗?
答案 0 :(得分:1)
TensorFlow的GCS文件系统实现确实有一个可以配置的块级缓存,但对于您的用例,建议将图像预处理为TFRecord文件(来自Google搜索的random link)。来自GCS的小读取通常会导致吞吐量不佳。