如何将Azure Data Lake存储连接到Azure ML?

时间:2017-03-07 15:16:16

标签: azure azure-stream-analytics azure-data-lake azure-machine-learning-studio cortana-intelligence

您好我开始学习天蓝色的数据湖和天蓝色的机器学习,我需要使用天蓝色的数据湖存储作为天蓝色的机器学习工作室输入数据。有任何选项,我经历了天蓝色的数据湖泊和机器学习文档,但我无法达到,最后我有一个解决方案 link但是他们提到它没有选择,但是这个帖子很旧,所以可能是微软人员在它上面添加了未来如果它请告诉我,让我知道谢谢你。

3 个答案:

答案 0 :(得分:2)

我建议如下:

  • 使用教程here获取ADLS的租户ID,客户ID和客户端密码。
  • 通过将其作为脚本包附加到执行Python脚本模块,在AML Studio上安装azure-datalake-store Python包。
  • 在“执行Python脚本”模块中,导入azure-datalake-store包并使用您的租户ID,客户端ID和客户端密钥连接到ADLS。
  • 从ADLS下载所需的数据并将其转换为Python脚本模块中的数据框;返回该数据帧以使数据在AML Studio的其余部分中可用。

答案 1 :(得分:0)

当然,您可以使用参考程序集根据ADLS数据向USQL添加认知服务。 https://docs.microsoft.com/en-us/azure/data-lake-analytics/data-lake-analytics-u-sql-cognitive

答案 2 :(得分:0)

您可以查看以下Microsoft Azure文档:

  1. 创建数据科学环境,以便在Azure Data Lake中构建可扩展的端到端解决方案。

  2. 此环境用于分析大型公共数据集,通过数据科学流程的规范步骤,从数据采集到模型培训,再到模型作为Web服务的部署。 / p>

  3. U-SQL用于处理,探索和采样数据。

  4. Python和Hive与Azure Machine Learning Studio一起用于构建和部署预测模型。

  5. 链接:https://docs.microsoft.com/en-us/azure/machine-learning/team-data-science-process/data-lake-walkthrough