通过Power BI上的Spark Thrift服务器连接/访问Hive数据

时间:2018-03-20 22:31:22

标签: apache-spark server thrift

我对多平台上的数据连接比较陌生,我的要求很简单,我需要能够通过Power BI访问Spark Thrift服务器,任何人都可以指导我所需的步骤吗?

1 个答案:

答案 0 :(得分:0)

我必须整合相当多的大数据和分析工具,并拥有丰富的spark经验

通常我会在tableau文档中查找它 https://onlinehelp.tableau.com/current/pro/desktop/en-us/examples_sparksql.html

或工具的文档
https://powerbi.microsoft.com/en-us/blog/power-bi-desktop-november-feature-summary/#spark

但我偏爱这些文档 https://github.com/oracle/learning-library/blob/master/workshops/journey2-new-data-lake/files/18.1.4/pdf/Connecting%20DVD3%20and%20Spark.pdf

您需要确保自己已spark-thift并听取开放端口。那么您将需要不同的信息以及您正在使用的连接类型(jdbcodbc ...)

假设您有DirectQuery的预览版本 https://docs.microsoft.com/en-us/power-bi/desktop-directquery-data-sources