我对机器学习世界还是一个新手,正在寻找一些指导,以指导如何继续我一直在从事的项目。现在,我正在尝试将Food-101数据集输入到SageMaker中的“图像分类”算法中,然后将此训练后的模型部署到AWS Deeplens上以具有食物检测功能。不幸的是,数据集仅包含组织在子文件夹中的原始图像文件以及.h5文件(不确定是否可以直接将这种文件类型输入sageMaker吗?)。从我收集的数据来看,这两种都不是将此数据集输入SageMaker的合适方法,我想知道是否有人可以帮助我指出正确的方向,说明如何为SageMaker正确准备数据集,即转换为.rec或其他内容。如果这个问题的范围很广,我很抱歉,我仍然是所有这一切的初学者,我只是被困住了,不知道如何进行,所以你们可能提供的任何帮助都是很棒的。谢谢!
答案 0 :(得分:1)
如果您想使用内置算法对图像进行分类,则可以使用图像格式或RecordIO格式,例如:https://docs.aws.amazon.com/sagemaker/latest/dg/image-classification.html#IC-inputoutput
图像格式非常简单:只需使用图像列表构建清单文件即可。对于您来说,这可能是一个简单的解决方案,因为您已经在文件夹中整理了图像。
RecordIO要求您使用“ im2rec”工具来构建文件,例如:https://mxnet.incubator.apache.org/versions/master/faq/recordio.html。
数据集准备就绪后,您应该可以使用https://github.com/awslabs/amazon-sagemaker-examples/tree/master/introduction_to_amazon_algorithms
上的示例笔记本。