应用错误收集

在Apache Spark中，如何将数据从执行程序推送到自己的表？

时间：2017-03-31 20:41:01

标签： apache-spark spark-streaming teradata

这是针对特定用例的 - 我们正在尝试使用Spark Streaming将数据从Apache Kafka流式传输到Teradata DB。我们一直在使用JDBC驱动程序加载到Teradata中。我们增加了执行程序的数量，并开始注意到Teradata端的阻塞。我们可以看到每个执行程序都试图将数据加载到表中，从而阻止了另一个执行程序的负载。我们最终进行了重新分区，因此只有1个执行程序写入表中。我想知道我们是否可以让执行者写入自己的表格。

谢谢！

0 个答案:

没有答案

如何设置Spark执行器内存？
如何调整spark执行器编号，内核和执行程序内存？
怎么能杀死Executor处理来自Driver的spark
在Apache Spark中，如何将数据从执行程序推送到自己的表？
如何在执行程序上处理RDD
Spark执行器，驱动程序，执行程序核心，执行程序内存的值
如何从HDFS中的数据创建EXTERNAL Spark表
Apache Spark：如何将自定义消息从执行器发送到驱动程序
Spark中与数据节点相关的“ total-executor-cores”参数
从S3加载数据会杀死执行器

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？