应用错误收集

我的2美分。这就是我如何使用它，但可能有更好的方法来实现它：

<强> 1。用以下两行替换了您的导入标题： import org.apache.spark.{SparkContext, SparkConf} import org.apache.spark.SparkContext._

<强> 2。创建一个基本的build.sbt文件：

name：=“Movie Similarities”

版本：=“1.0”

scalaVersion：=“2.10.4”

libraryDependencies + =“org.apache.spark”%%“spark-core”％“1.0.1”％“提供”

libraryDependencies + =“org.apache.spark”%%“spark-sql”％“1.0.1”％“提供”

libraryDependencies + =“org.apache.spark”%%“spark-streaming”％“1.0.1”％“提供”

解析器+ =“Akka Repository”位于“http://repo.akka.io/releases/”

第3。建立它：

sbt package

<强> 4。运行它（确保你的路径上有spark-submit）：

spark-submit --class“MovieSimilarities” - master local [4] target / scala-2.10 / movie-similarities_2.10-1.0.jar local

<强> 5。收集输出（对于MovieLens 100k）：

星球大战（1977）|父亲节（1997年）| -0.6625 | -0.4417 | 0.9074 | 0.0397

星球大战（1977）| Jason's Lyric（1994）| -0.9661 | -0.3978 | 0.8110 | 0.0141

星球大战（1977）|闪电杰克（1994）| -0.7906 | -0.3953 | 0.9361 | 0.0202

星球大战（1977）|标记为死亡（1990）| -0.5922 | -0.3807 | 0.8729 | 0.0361

星球大战（1977）|混合坚果（1994）| -0.6219 | -0.3731 | 0.8806 | 0.0303

星球大战（1977）| Poison Ivy II（1995）| -0.7443 | -0.3722 | 0.7169 | 0.0201

星球大战（1977）|在感官境界（Ai no corrida）（1976）| -0.8090 | -0.3596 | 0.8108 | 0.0162

星球大战（1977）|发生了什么......（1994）| -0.9045 | -0.3392 | 0.8781 | 0.0121

星球大战（1977）|女性变态（1996）| -0.8039 | -0.3310 | 0.8670 | 0.0141

星球大战（1977）| Celtic Pride（1996）| -0.6062 | -0.3175 | 0.8998 | 0.0220

根据您的环境，可以通过多种方式在gist中运行程序。

以上各项的先决条件是拥有必要的Spark库。如果从REPL运行它，那么库已经在您的类路径中。我个人会建议这样做，因为那样你将执行程序的每一步，看看每一步的输出是什么。

如果要将其部署为独立程序，则需要先设置sbt并为代码创建相应的build.sbt和项目结构。您可以按照此处的说明创建独立程序。 http://spark.apache.org/docs/latest/quick-start.html#standalone-applications