应用错误收集

如果doc不存在，如何在使用pyspark进行批量更新时忽略异常

时间：2017-06-23 22:28:16

标签： python apache-spark elasticsearch pyspark elasticsearch-hadoop

我正在尝试使用pyspark中的elasticsearch hadoop包进行更新操作。它在文档中说如果没有找到数据，则抛出异常。在pyspark中忽略此异常的最佳方法是什么？或者是否可以通过python elasticsearch API传递一些类似raise_on_exception = False，raise_on_error = False的内容？谢谢！

1 个答案:

答案 0 :(得分：0)

最后得到了答案：https://discuss.elastic.co/t/how-to-ignore-exceptions-when-bulk-update-with-pyspark-if-doc-doesnt-exist/90739/2

＆＃34;发生错误时无法抑制错误。如果执行更新时缺少某个值，则连接器无法执行任何操作，但任务失败。＆＃34;

mysql插入如果不存在则更新
如果值不存在，则更新Mysql
如果LEFT JOIN不存在则忽略
SimpleApp.py不存在
pyspark数据框如果不存在则添加一列
在数据库不存在时处理异常
如果doc不存在，如何在使用pyspark进行批量更新时忽略异常
Ffmpeg忽略流（如果它不存在）
SSRS - 如果数据库不存在则忽略
使用pyspark进行单元测试时如何忽略spark_home

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？