标签: docker machine-learning dataset dockerfile
我有几个Docker镜像可以处理几个大数据集。我喜欢将图像看作是获取数据集和输出信息的函数。
每个图像必须在“消耗”它们之前格式化数据集。我想我应该在实例化图像之前在主机上进行格式化。
是否有工具可以帮助我管理这些数据集?或者我应该自己实施它?