应用错误收集

如何限制mongo-spark-connector与mongo集群建立过多连接？

时间：2020-09-25 12:02:09

标签： mongodb apache-spark mongo-scala-driver

我使用mongo-spark-connector在spark中构建了一个简单的数据导出器作业。此作业从mongo中读取集合并将其写入S3。但是，对于庞大的馆藏（2B文档），无论执行者和执行者核心的数量如何，它都会打开太多的连接。我尝试查看他们的官方文档，以查找是否存在限制连接数量的连接器配置。但是他们也没有。有什么方法可以控制我的Spark应用程序产生的连接数量？

0 个答案:

没有答案

Spark独立群集不接受连接
如何将Spark EMR集群与AWS elasticsearch集群连接
将pyspark集群连接到Cassandra集群ERROR o64.load
Spark cassandra连接器在独立Spark群集中不起作用
spark独立集群与Eclipse classnonfoundexeption
如何将Sparlyr连接到Spark独立集群
如何与Cloudera集群建立SQL / Hive连接以读取集群中存储的数据
Django与Mongo Atlas集群的连接
如何限制mongo-spark-connector与mongo集群建立过多连接？
如何在Kubernetes中通过SSL将Apache Spark连接到Cassandra集群

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？