scala - 火花关闭动态分配

火花关闭动态分配

时间：2020-07-24 19:00:58

标签： scala apache-spark hadoop cloudera

我想确保我的spark作业不会占用超过我通过的内存，比方说，根据我的理解，关闭动态分配（spark.dynamicAllocation.enabled = false）后，该作业可以使用的最大内存为400GB，并且传递--num-executors --executor-memory --driver-memory是否在Cloudera堆栈中完成工作？如果有错，请更正。

我还必须设置其他任何设置以确保火花作业不会超出限制。

1 个答案:

答案 0 :(得分：0)

在我的工作中找到了一个解决方案 Cloudera 集群有一个特殊的纱线参数，它不会让作业超过必须关闭或重置它的特定限制。

https://community.cloudera.com/t5/Support-Questions/Yarn-memory-allocation-utilization/td-p/216290

https://docs.cloudera.com/HDPDocuments/HDP2/HDP-2.6.4/bk_command-line-installation/content/determine-hdp-memory-config.html

火花动态分配执行器失败
同时提交多个火花应用（动态资源分配）
火花动态资源分配如何在YARN上工作（关于NodeManagers）？
火花混合动态/静态分区
火花容器手动配置
火花状态
火花纱的资源分配
火花执行-火花执行作业和火花动作之间的关系
如何关闭火花黑名单？
火花关闭动态分配

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？