apache-spark - callJMethod出错（sqlContext，＆＃34; parquetFile＆＃34;，路径）：无效的jobj 1.如果SparkR重新启动，则需要重新执行Spark操作

callJMethod出错（sqlContext，＆＃34; parquetFile＆＃34;，路径）：无效的jobj 1.如果SparkR重新启动，则需要重新执行Spark操作

时间：2015-07-20 09:31:28

标签： apache-spark yarn sparkr

我想通过SparkR shell在yarn-client上运行sparkR。所以我这样做：

./sparkR

sparkR.stop();
sc <- sparkR.init(master="yarn-client",appName="SparkR-Parquet-example2", sparkHome = Sys.getenv("SPARK_HOME"),sparkExecutorEnv = list(HADOOP_CONF_DIR=”/etc/hadoop/conf.cloudera.yarn”,YARN_CONF_DIR=”/etc/hadoop/conf.cloudera.yarn”))
sqlContext <- sparkRSQL.init(sc)
path<-"hdfs://year=2015/month=1/day=9"
AppDF <- parquetFile(sqlContext, path)

Error in callJMethod(sqlContext, "parquetFile", paths) : 
Invalid jobj 1. If SparkR was restarted, Spark operations need to be re-executed.

我是新来的火花，任何人都可以帮忙解决它吗？

我使用的是spark-1.4.0-bin-hadoop2.6

0 个答案:

没有答案

MSBuild并确定是否需要执行目标
哪些数据库操作必须在后台执行？
hdfs：在sparkR shell中读取parquetfile时没有这样的文件或目录错误
callJMethod出错（sqlContext，＆＃34; parquetFile＆＃34;，路径）：无效的jobj 1.如果SparkR重新启动，则需要重新执行Spark操作
我是否需要在纱线群集中的每个工作节点中安装R才能运行SparkR？
if中的sparkR错误（returnStatus！= 0）
我尝试在sparkR中使用textFile时出错
Error "Invalid method csv for object" when using spark_read_csv in sparklyr
如何解决＆＃34; sql（sqlContext ...）＆＃39;已被弃用＆＃34; SparkR中的警告
确定是否需要将资产重新缓存在内存中

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？