应用错误收集

Spark：检查镶木地板写入是否成功

时间：2016-08-30 08:02:33

标签： scala apache-spark

我有一个Spark 1.6.2（在Scala上）进程写入一个镶木地板文件，当它完成时，它应该再次加载为DataFrame。是否有一个Spark方法来检查DataFrameWriter成功完成并仅在此之后恢复？我尝试过使用Future和on Complete，但它与Spark无关（SparkContext关闭）。

我假设我可以在文件夹中查找_SUCCESS文件并循环直到它存在，但是如果进程卡住了，我将会有一个无限循环..

0 个答案:

没有答案

将数据从dstream写入镶木地板
镶木地板格式HDFS写
在镶木地板写作期间Spark SparkChannelException异常
Spark：检查镶木地板写入是否成功
Slow Parquet使用Spark写入HDFS
Spark 2.2无法将df写入镶木地板
Parquet在spark上写出OutOfMemoryException
结构化流写入不同的实木复合地板文件夹
通过自定义分区写入镶木地板
TB数据写入实木复合地板

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？