我正在尝试使用python-sagemaker-sdk估计器类对亚马逊sagemaker进行培训。
我有以下
estimator = PyTorch(entry_point='training_scripts/train_MSCOCO.py',
source_dir='./',
role=#dummy_role,
train_instance_type='ml.p3.2xlarge',
train_instance_count=1,
framework_version='1.0.0',
output_path=#dummy_output_path,
hyperparameters={'lr': 0.001,
'batch_size': 32,
'num_workers': 4,
'description': description})
隐藏了角色和output_path以保护隐私。
我收到以下错误消息,“没有模块命名为training_scripts \ train_MSCOCO”。
当我运行python -m training_scripts.train_MSCOCO时,脚本运行良好。但是,当我通过entry_point='training_script.train_MSCOCO.py
时,它将无法运行,“在目录“ ./”中找不到名为“ training_scripts.train_MSCOCO.py”的文件。“
我对如何在AWS sagemaker中从我的存储库的顶层运行嵌套的培训脚本感到困惑,因为它们似乎具有冲突的路径需求,一个使用python模块点表示法,另一个使用标准文件路径斜杠表示法。