PyHive忽略Hive配置

时间:2018-12-13 10:14:54

标签: hadoop hive pyhive

我间歇性地收到错误消息

  

由于VERTEX_FAILURE,DAG无法成功。

通过PyHive运行Hive查询时。由于这个原因,Hive在EMR群集上运行,该群集中hive-site.xml文件中的hive.vectorized.execution.enabled设置为false

我可以通过Hive连接上的配置来设置上述属性,并且每次执行该查询时都可以成功运行我的查询,但是我想确认这已解决了该问题,并且肯定是Hive确实如此-site.xml被忽略。

任何人都可以确认这是否是预期的行为,或者因为我无法找到任何方法来通过PyHive检查Hive配置?

谢谢!

1 个答案:

答案 0 :(得分:0)

PyHive是连接到HiveServer2的瘦客户端,就像Java或C客户端(通过JDBC或ODBC)一样。它在本地计算机上不使用任何Hadoop配置文件。 HS2会话从服务器端设置的任何属性开始。
ImPyla BTW也是如此。

因此,您有责任根据自己的Python代码设置自定义会话属性,例如执行此语句...
SET hive.vectorized.execution.enabled =False
...在运行SELECT之前。