HdInsight上的Spark ML与Azure机器学习工作室?

时间:2018-04-11 08:11:04

标签: azure machine-learning apache-spark-mllib azure-machine-learning-studio

HdInsight上的Apache Spark ML比Azure ML studio更受欢迎的场景是什么?

1 个答案:

答案 0 :(得分:1)

这是Microsoft提供的两种不同产品。我将尝试解释这些差异,但这将取决于您的需求。还有Azure Databricks也运行Spark,因此,如果这些不能满足您的需求,可以查看。

Azure ML Studio

  • 使用不需要编码的拖放界面,除非您需要以编程方式使用REST API来调用模型。
  • 在可用模型方面有限,以及您可以执行的所有数据清理,但您可以执行自定义R / Python脚本来为您执行这些操作。
  • 据我所知,这是免费使用和玩的,但Azure ML Services是微软在为生产用途构建模型方面所关注的。

使用Spark群集的HDInsight

  • 创建一个安装了Spark的虚拟机,您可以将其连接到该虚拟机或运行Jupyter笔记本。
  • 允许您使用Azure Data Factory创建完整的大数据管道。
  • 为您提供SparkML,您可以使用Azure ML Studio构建更多自定义模型。
  • 可以比Azure ML Studio更好地处理流数据。

我认为这主要归结为您是想尝试制作基本模型,还是想构建一个完整的大数据工作流程来创建机器学习模型。

希望至少能让你更好地理解两者之间的关系。如果您有更多问题,请随时提出。