我试图在Scala + Spark中实现简单的WordCount。这是我的代码
object FirstObject {
def main(args: Array[String]) {
val input = "/Data/input"
val conf = new SparkConf().setAppName("Simple Application")
.setMaster("spark://192.168.1.162:7077")
val sparkContext = new SparkContext(conf)
val text = sparkContext.textFile(input).cache()
val wordCounts = text.flatMap(line => line.split(" "))
.map(word => (word,1))
.reduceByKey((a,b) => a+b)
.sortByKey()
wordCounts.saveAsTextFile("/Data/output")
}
这项工作适用于54s
,最后什么都不做。是不是将输出写入/Data/output
此外,如果我将saveAsTextFile
替换为forEach(println)
,则会生成所需的输出。
答案 0 :(得分:1)
您应该检查/ data / output文件夹的用户权限。 此文件夹应具有特定用户的写入权限。