应用错误收集

Spark容器失败。我相信我得到的结果吗？

时间：2016-10-08 13:44:32

标签： apache-spark apache-spark-sql yarn

我有一个很长的Spark工作，只包含一个map操作。我尝试使用不同数量的分区，执行程序以及我可以提供的最大内存量（16G + 2G的开销）启动它几次。在我上次尝试期间，由于内存开销而导致少数执行程序被杀死，然而，输出已经产生并且看起来没问题（显然，我无法检查数据帧的所有行）。而且，我在输出目录中找到了一个_SUCCESS文件。

我相信我得到的输出吗？

1 个答案:

答案 0 :(得分：0)

我认为输出是正确的，因为你有_SUCCESS文件，并且如果你们中的某些执行者因内存不足而死亡，那么工作负载将被转移到另一个执行者。

我应该在Web应用程序中盲目信任客户端数据吗？
Spark saveAsTextFile（）导致Mkdirs无法为目录的一半创建
Spark容器失败。我相信我得到的结果吗？
Spark CodeGenerator无法编译，很少得到NPE
为什么我在这里得到不同的结果
由于AM Container，应用程序失败了2次
如何为Spark JDBC连接指定信任存储和信任存储类型
KNN模型获得100％的准确性-我应该相信结果吗？
工作容器无法重新连接到Spark驱动程序
Page.user.identity.name返回信任关系失败

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？