如何优化数据管道以在TPU上进行训练

时间:2019-04-25 14:13:22

标签: image tensorflow classification tfrecord tpu

我正在尝试了解如何优化数据管道以进行TPU培训。 Google TF网站上有一些资源,例如[1]。但是,尚不清楚使用哪种格式以及如何使用。例如,对于图像分类,我们既可以使用原始图像格式(一个文件中的一个图像),也可以将图像存储到TFRecord中。如果我需要处理大量图像,应使用原始图像或TFRecords使用哪种方法?如果稍后,则每个TFRecord可以存储多少图像,等等。[1]中的资源仅显示如何通过预取,通过并行调用读取等方式并行化数据读取,但未解决如何组织的主要问题数据以在TPU上获得最佳性能。是否有人有经验并可以分享。在我第一次尝试使用TPU时,主要由于IO,我的TPU利用率很差。我使用了TFRecrods,每个文件具有1000张图像,并且使用了prefetch和num_parallel_calls,但是TPU利用率仍然很差。这就是为什么我要寻找有关数据组织的建议。

谢谢, 瓦伦丁。

[1] https://www.tensorflow.org/guide/performance/datasets

0 个答案:

没有答案