我间歇性地收到错误消息
由于VERTEX_FAILURE,DAG无法成功。
通过PyHive运行Hive查询时。由于这个原因,Hive在EMR群集上运行,该群集中hive-site.xml文件中的hive.vectorized.execution.enabled
设置为false
。
我可以通过Hive连接上的配置来设置上述属性,并且每次执行该查询时都可以成功运行我的查询,但是我想确认这已解决了该问题,并且肯定是Hive确实如此-site.xml被忽略。
任何人都可以确认这是否是预期的行为,或者因为我无法找到任何方法来通过PyHive检查Hive配置?
谢谢!
答案 0 :(得分:0)
PyHive
是连接到HiveServer2的瘦客户端,就像Java或C客户端(通过JDBC或ODBC)一样。它在本地计算机上不使用任何Hadoop配置文件。 HS2会话从服务器端设置的任何属性开始。
ImPyla
BTW也是如此。
因此,您有责任根据自己的Python代码设置自定义会话属性,例如执行此语句...
SET hive.vectorized.execution.enabled =False
...在运行SELECT
之前。