启动spark-shell时出现以下错误。我将使用Spark来处理SQL Server中的数据。我可以忽略这些错误吗?
java.io.IOException:找不到Hadoop二进制文件中的可执行文件null \ bin \ winutils.exe。
java.lang.IllegalArgumentException:实例化'org.apache.spark.sql.hive.HiveSessionState'时出错
引起:java.lang.reflect.InvocationTargetException:java.lang.IllegalArgumentException:实例化'org.apache.spark.sql.hive.HiveExternalCatalog'时出错:
引起:java.lang.IllegalArgumentException:实例化'org.apache.spark.sql.hive.HiveExternalCatalog'时出错
引起:java.lang.IllegalArgumentException:实例化'org.apache.spark.sql.hive.HiveExternalCatalog'时出错
引起:java.lang.reflect.InvocationTargetException:java.lang.reflect.InvocationTargetException:java.lang.RuntimeException:java.lang.RuntimeException:运行命令以获取文件权限时出错:java.io.IOException :( null)命令字符串中的条目:null ls -FC:\ tmp \ hive
引起:java.lang.reflect.InvocationTargetException:java.lang.RuntimeException:java.lang.RuntimeException:运行命令以获取文件权限时出错:java.io.IOException:(null)命令字符串中的条目:null ls -FC:\ tmp \ hive
引起:java.lang.RuntimeException:java.lang.RuntimeException:运行命令以获取文件权限时出错:java.io.IOException:(null)命令字符串中的条目:null ls -FC:\ tmp \ hive
答案 0 :(得分:10)
tl; dr 你不愿意。
嗯,它可能可能,但是如果你刚刚开始前往Spark的土地,那么努力就不会有回报。
Windows对我来说从来就不是一个对开发人员友好的操作系统,每当我教人们Spark并且他们使用Windows时我只是认为我们必须经过winutils.exe
设置但很多次还有如何在命令行上工作。
请按以下方式安装winutils.exe
:
cmd
c:\hadoop\bin
bin
)的目录,例如: set HADOOP_HOME=c:\hadoop
%HADOOP_HOME%\bin
c:\tmp\hive
目录winutils.exe chmod -R 777 \tmp\hive
spark-shell
并运行spark.range(1).show
以查看单行数据集。