我正在尝试在Azure Batch AI群集上运行AutoML实验。我创建了以下AutoMLConfig
AutoMLConfig(task='classification',
debug_log='automl_errors.log',
path=project_folder,
compute_target=compute_target,
data_script=project_folder + "/get_data.py",
exit_score=0.9985,
**automl_settings)
在get_data python脚本中,我想从默认数据存储中读取数据。是否有可能将安装的数据存储区作为参数传递给此脚本(类似于Estimator和script_params):
est = Estimator(
source_directory=script_folder,
script_params=script_params,
compute_target=compute_target,
entry_script='train.py',
conda_packages=['scikit-learn']
)
如果没有,请问任何人可以建议从get_data脚本中的默认数据存储中读取数据的最佳方法是什么?
答案 0 :(得分:0)
批处理AI已退休:https://docs.microsoft.com/en-us/previous-versions/azure/batch-ai/overview-what-happened-batch-ai
我们建议您迁移到Azure ML,并且可以使用Azure ML python SDK中的数据集模块来处理数据:https://docs.microsoft.com/en-us/azure/machine-learning/service/how-to-access-data
SDK:https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.dataset?view=azure-ml-py
示例笔记本:https://github.com/Azure/MachineLearningNotebooks/tree/master/work-with-data/datasets