标签: scala apache-spark hdfs
我是Apache Spark的新手。在我的实验室里,我制作了一个8个星团。我需要使用一些可以被所有节点访问的外部通用存储(hdfs是我的选择)。我有一个未使用的ubuntu pc与静态IP。
任何人都可以指导我如何
RDD =sc.textFile("hdfs://bucketname/customer-orders.csv")