Question

我是Ubuntu 16.04的假人，拼命想让Spark工作。我试图使用stackoverflow上找到的答案解决我的问题，但我无法解决任何问题。使用bin文件夹中的./spark-shell命令启动spark我收到此消息

WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable".

我正在使用Java版

java version "1.8.0_101
Java(TM) SE Runtime Environment (build 1.8.0_101-b13)
Java HotSpot(TM) 64-Bit Server VM (build 25.101-b13, mixed mode).

Spark是最新版本：2.0.1 with Hadoop 2. 7。我还重新使用了较旧的Spark软件包，1.6.2和Hadoop 2.4，但我得到了相同的结果。我也尝试在Windows上安装Spark，但它似乎比在Ubuntu上执行它更难。

我还尝试从我的笔记本电脑上运行Spark上的一些命令：我可以定义一个对象，我可以创建一个RDD并将其存储在缓存中，我可以使用像.map()这样的函数，但是当我尝试运行时函数.reduceByKey()我收到几串错误消息。

可能是Hadoop库编译为32位，而我是64位？

感谢。

Answer 1

修复步骤：

Answer 2