应用错误收集

Spark在本地运行

时间：2015-04-16 12:22:38

标签： multithreading parallel-processing apache-spark

SparkContext的master参数确定要使用的集群。我可以指定local，它将Spark设置为使用一个工作线程在本地运行，或者指定local [k]，它将Spark设置为使用K个工作线程本地运行（在我的情况下为24个内核）。为什么两种方式给我类似的运行时间？我不正确地理解它吗？我试图在数据集上运行MLIB包，并进行一些RDD转换。

0 个答案:

没有答案

Spark在本地运行
设置spark在本地多线程模式下运行，为什么只有一个cpu在运行？
在本地模式下运行spark应用程序
如何调整在本地模式下运行的Spark应用程序的内存
并行运行spark作业并使用在本地模式下运行的单个spark上下文
当不运行本地模式时，spark-nlp addFile不支持本地目录
使用本地Python运行SPARK作业
在本地集群上运行spark作业无限运行
从本地IDE运行Spark
控制以本地模式运行pyspark的网络流量？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？