我是Ubuntu 16.04的假人,拼命想让Spark工作。
我试图使用stackoverflow上找到的答案解决我的问题,但我无法解决任何问题。
使用bin文件夹中的./spark-shell
命令启动spark我收到此消息
WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable".
我正在使用Java版
java version "1.8.0_101
Java(TM) SE Runtime Environment (build 1.8.0_101-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.101-b13, mixed mode).
Spark是最新版本:2.0.1 with Hadoop 2. 7。 我还重新使用了较旧的Spark软件包,1.6.2和Hadoop 2.4,但我得到了相同的结果。我也尝试在Windows上安装Spark,但它似乎比在Ubuntu上执行它更难。
我还尝试从我的笔记本电脑上运行Spark上的一些命令:我可以定义一个对象,我可以创建一个RDD并将其存储在缓存中,我可以使用像.map()
这样的函数,但是当我尝试运行时函数.reduceByKey()
我收到几串错误消息。
可能是Hadoop库编译为32位,而我是64位?
感谢。
答案 0 :(得分:24)
修复步骤:
HADOOP_HOME
设置为指向该目录。$HADOOP_HOME/lib/native
添加到LD_LIBRARY_PATH
。答案 1 :(得分:3)