在Docker中使用大型数据集

时间:2017-04-15 00:08:35

标签: docker machine-learning dataset dockerfile

我有几个Docker镜像可以处理几个大数据集。我喜欢将图像看作是获取数据集和输出信息的函数。

每个图像必须在“消耗”它们之前格式化数据集。我想我应该在实例化图像之前在主机上进行格式化。

是否有工具可以帮助我管理这些数据集?或者我应该自己实施它?

0 个答案:

没有答案