从Scala中的HDFS读取字符串内容

时间:2016-11-05 23:19:20

标签: scala hdfs

什么是从Scala中读取HDFS的简单方法,还能够创建依赖HDFS而无需访问该HDFS的单元测试?莫名其妙地模拟/存根HDFS?

1 个答案:

答案 0 :(得分:0)

我建议使用spark

val textFile = sc.textFile("hdfs://...")
val counts = textFile.flatMap(line => line.split(" "))
                 .map(word => (word, 1))
                 .reduceByKey(_ + _)
counts.saveAsTextFile("hdfs://...")