我是Scala / Spark的新手。我正在尝试编译并运行示例GraphX代码。 原始文件链接:PageRank
我的代码经过轻微编辑以避免出现问题:
// scalastyle:off println
package org.apache.spark.examples.graphx
// $example on$
import org.apache.spark.graphx.GraphLoader
// $example off$
import org.apache.spark.sql.SparkSession
/**
* A PageRank example on social network dataset
* Run with
* {{{
* bin/run-example graphx.PageRankExample
* }}}
*/
object PageRankExampl {
def main(args: Array[String]): Unit = {
// Creates a SparkSession.
val spark = SparkSession
.builder
.appName("PageRankExampl")
.getOrCreate()
val sc = spark.sparkContext
// $example on$
// Load the edges as a graph
val graph = GraphLoader.edgeListFile(sc, "data/graphx/followers.txt")
// Run PageRank
val ranks = graph.pageRank(0.0001).vertices
// Join the ranks with the usernames
val users = sc.textFile("data/graphx/users.txt").map { line =>
val fields = line.split(",")
(fields(0).toLong, fields(1))
}
val ranksByUsername = users.join(ranks).map {
case (id, (username, rank)) => (username, rank)
}
// Print the result
println(ranksByUsername.collect().mkString("\n"))
// $example off$
spark.stop()
}
}
// scalastyle:on println
构建文件:
name := "hello"
version := "1.0"
libraryDependencies ++= Seq(
"org.apache.spark" % "spark-core_2.11" % "2.2.1" % "provided",
"org.apache.spark" % "spark-sql_2.11" % "2.2.1" % "provided",
"org.apache.spark" % "spark-graphx_2.11" % "2.2.1" % "provided"
)
我得到的错误:
启动sbt:使用-help调用其他选项
[info]将当前项目设置为hello(在构建文件中:/usr/local/spark-2.2.1-bin-hadoop2.7/nofel_test /)
>跑 [info]将1个Scala源编译为/usr/local/spark-2.2.1-bin-hadoop2.7/nofel_test/target/scala-2.9.1/classes ...
缺少[错误] Graph所需的类文件。
[error]引用类型包反射的ClassTag是指不存在的符号。
[错误]发现一个错误
[error] {file:/usr/local/spark-2.2.1-bin-hadoop2.7/nofel_test/} default-b08e19 / compile:compile:编译失败
[错误]总时间:2秒,2018年3月26日晚上11:14:28
答案 0 :(得分:0)
我在构建文件中添加了一行,并且行得通。如果有人知道为什么需要此行(scalaVersion)的原因,请告诉我。
K