标签: dataset
该公司要我写一个数据集组织计划,原来的话是这样的:
“是否可以创建类似于docker image的数据集组织,其中每个数据集由多层组成。我认为这种方法有很多好处。 1.您可以为数据集构建哈希值,以确保数据集的一致性; 2.分层管理提供了潜在的缓存可能性; 3.可以管理数据集的版本”
我已经在网上搜索很长时间了,但是没有找到。是否有人在这方面有任何经验或信息?