我已经在我的本地系统上安装了Apache Hive,我需要连接到Azure Data Lake来查询它的数据。如何配置?
答案 0 :(得分:0)
有关如何将Hadoop连接到Azure Data Lake的详细信息,请访问此处 - https://hadoop.apache.org/docs/current/hadoop-azure-datalake/index.html。
您需要运行最新版本的Hadoop才能让模块本机化。
有博客谈论启用此连接,例如 - https://medium.com/azure-data-lake/connecting-your-own-hadoop-or-spark-to-azure-data-lake-store-93d426d6a5f4。
但除非您在Azure数据湖存储(ADLS)帐户所在的Azure区域中运行Hadoop,否则您的解决方案将不是最佳解决方案。您将导致数据读/写延迟以及成本,因为您将在读取期间将数据从Azure区域中删除。相信你已经将这些考虑在你的计划中。
谢谢, Sachin Sheth, Azure Data Lake项目经理。