在Azure Databricks群集上使用HDInsights SPARK的优势

时间:2019-01-24 12:50:56

标签: hdinsight azure-databricks

我已经浏览了多个文档,但是与Azure Databricks群集相比,无法获得使用HDInsigths spark群集的优势列表。两者之间有什么主要区别。我基本上需要HDInsights支持的功能列表,而Azure Databricks不支持的功能列表。

1 个答案:

答案 0 :(得分:1)

让我带您经历视觉之旅,并显示一些屏幕截图。我已附上了一些Azure Spark和Azure Databricks的屏幕截图。 Azure Spark是Hadoop上的HDInsight(Hortomwork HDP)捆绑包。启动服务时,Databrick看起来非常不同。

您必须选择节点数和配置,其余服务将由Azure服务进行配置。

如果您查看HDInsight Spark实例,它将具有以下功能。请参阅以下两个屏幕截图HDInsight Instance for spark && and available features

  1. Apache Ranger
  2. 企业安全软件包
  3. HDInsight IO缓存
  4. 安全外壳(SSH)访问
  5. HDInsight应用程序
  6. 自定义虚拟网络
  7. 自定义Hive Metastore
  8. 自定义Oozie Metastore
  9. 对Data Lake Storage Gen1的访问

另一方面,Azure Spark是一个完整的抽象,并提供以下功能而无需任何配置。选择资源Data Bricks并输入基本信息,实例将启动refer deployment status。您的实例已启动并正在运行see here.。您的平台可以使用了,see here。您所有的笔记本,教程等均可用,并且可以使用。您无需考虑其他任何事情。 创建databricks实例后,您的最终资源将如下所示。 here

数据砖的价格差异很大,您可以参考pricing here pricing is here

的数据块链接