使用Spark连接器的Power Bi和Spark Thrift服务器之间的连接速度非常慢

时间:2019-02-27 02:56:10

标签: apache-spark powerbi spark-thriftserver

我正在使用Power Bi桌面应用程序中的“ spark”连接器通过启用了“ SSL”和“直接查询”选项的“ HTTP”连接模式连接到Spark Thrift服务器。

enter image description here

但是连接成功,但是Power Bi应用程序与Spark Thrift服务器之间的每次通信都存在大约10分钟的长时间延迟(例如,身份验证,加载元数据,加载特定表等)。 。数据源是“ Hive Server2”。

“ hive-default.xml”中的我的Spark Thrift配置如下:

<property>
    <name>hive.server2.authentication</name>
    <value>PAM</value>
</property>
<property>
    <name>hive.server2.authentication.pam.services</name>
    <value>login,sudo,sshd</value>
</property>
<property>
    <name>hive.server2.use.SSL</name>
    <value>true</value>
</property>
<property>
    <name>hive.server2.keystore.path</name>
    <value>************</value>
</property>
<property>
    <name>hive.server2.keystore.password</name>
    <value>************</value>
</property>
<property>
    <name>hive.server2.transport.mode</name>
    <value>http</value>
</property>
<property>
    <name>hive.server2.thrift.http.port</name>
    <value>10001</value>
</property>
<property>
     <name>hive.server2.thrift.http.path</name>
     <value>cliservice</value>
</property>

首先,我怀疑“ SSL”加密正在减慢通信速度,因此我禁用了它,但是问题仍然存在。因此,我得出结论认为这与该问题无关。

关于如何提高沟通速度的任何想法?

注意:我测试了使用启用了“ HTTP”模式和“ SSL”加密的“直线”命令行工具连接到Spark Thrift服务器的速度非常快,因此消除了任何网络延迟问题。 / p>

0 个答案:

没有答案