我正在使用Power Bi桌面应用程序中的“ spark”连接器通过启用了“ SSL”和“直接查询”选项的“ HTTP”连接模式连接到Spark Thrift服务器。
但是连接成功,但是Power Bi应用程序与Spark Thrift服务器之间的每次通信都存在大约10分钟的长时间延迟(例如,身份验证,加载元数据,加载特定表等)。 。数据源是“ Hive Server2”。
“ hive-default.xml”中的我的Spark Thrift配置如下:
<property>
<name>hive.server2.authentication</name>
<value>PAM</value>
</property>
<property>
<name>hive.server2.authentication.pam.services</name>
<value>login,sudo,sshd</value>
</property>
<property>
<name>hive.server2.use.SSL</name>
<value>true</value>
</property>
<property>
<name>hive.server2.keystore.path</name>
<value>************</value>
</property>
<property>
<name>hive.server2.keystore.password</name>
<value>************</value>
</property>
<property>
<name>hive.server2.transport.mode</name>
<value>http</value>
</property>
<property>
<name>hive.server2.thrift.http.port</name>
<value>10001</value>
</property>
<property>
<name>hive.server2.thrift.http.path</name>
<value>cliservice</value>
</property>
首先,我怀疑“ SSL”加密正在减慢通信速度,因此我禁用了它,但是问题仍然存在。因此,我得出结论认为这与该问题无关。
关于如何提高沟通速度的任何想法?
注意:我测试了使用启用了“ HTTP”模式和“ SSL”加密的“直线”命令行工具连接到Spark Thrift服务器的速度非常快,因此消除了任何网络延迟问题。 / p>