应用错误收集

火花/纱线：在一段时间内缓慢增加执行器的数量

时间：2016-09-26 20:49:15

标签： apache-spark pyspark yarn

我有一个Spark作业可以在使用Yarn管理的集群上运行（启用动态分配）。我的工作需要通过点击一些公司内部REST API来处理数据（这不是可选的）。 API团队告诉我他们可以自动扩展到大量并发请求，但他们需要一些时间来扩展。所以他们要求我限制我的Spark工作生成的请求/秒的增长率。

有没有简单的方法可以告诉Spark＆＃34;提升＆＃34;在预定义的时间段内均匀执行者的数量？

1 个答案:

答案 0 :(得分：1)

From the Spark Docs，您可以降低spark.dynamicAllocation.schedulerBacklogTimeout和spark.dynamicAllocation.sustainedSchedulerBacklogTimeout请求新执行者的速度。不过，这感觉有点像黑客。

JMeter加速期
Apache Spark：核心数与执行者数量
已启动的执行程序少于指定的执行程序数
当任务数量> 1时，纱线杀死容器。执行人数
Apache Jmeter Ramp-up期间
Spark与执行程序和核心数量的合并关系
Spark增加了纱线模式下执行程序的数量
火花/纱线：在一段时间内缓慢增加执行器的数量
Apache Spark：限制Spark App使用的执行程序数
为什么YARN上的驱动程序和执行程序的核心数与请求的数量不同？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？