Tensorflow数据集:从500个数据集中的10个随机选择的数据集中随机采样64条记录

时间:2019-11-22 01:46:35

标签: tensor tensorflow2.0

使用tensorflow 2.0解析tfrecord数据集-

我需要从J个总张量流data数据集中的M个随机数据集中取样N条记录。

例如-

tfrecord

批量为N。

生成N = 10, the number of samples from each M datasets M = 64, the number of randomly chosen datasets J = 1000, the total number of `.tfrecord` datasets on disk 的(N,M)批次。每一批是从J个说话者总数中从M个说话者中随机抽取的N个发音。

我看到两个https://www.tensorflow.org/api_docs/python/tf/data/experimental/choose_from_datasets

https://www.tensorflow.org/api_docs/python/tf/data/experimental/sample_from_datasets 存在,但看不到将它们组合的方法。欠佳的解决方法是创建一个提供示例的python生成器,但我正在寻找如何使用tfrecords和数据集API

0 个答案:

没有答案