查询在sparkSQL上运行得非常慢

时间:2016-03-31 10:22:36

标签: hadoop apache-spark apache-spark-sql yarn

我目前正在开发7个节点群集,每个群集有16个核心,使用128 GB内存。

我的配置如下:

enter image description here

我对连接的一些查询运行速度非常慢,而且我正处理数百万行的数据..

编辑: 查询包括连接.. Selecy a,b,c来自 (SELECT MAX(data_mo_dt)AS MAX_DATE FROM M_FRMLRY_PLAN_DRUG_RSTRCTN_TEMP)B 内部联接 M_FRMLRY_PLAN_DRUG_RSTRCTN_TEMP A. 在1 = 1 在哪里a.data_mo_dt> = Add_months(MAX_DATE,-23)

有人能建议我吗?

0 个答案:

没有答案