如何读取存储在cloudera主文件夹中的文件

时间:2016-06-11 18:15:50

标签: python apache-spark cloudera cloudera-quickstart-vm

我是python和spark的新手,我已经安装了cloudera quickstart,我正在尝试读取我在cloudera分发桌面中存在的cloudera主文件夹中创建的文件,如何读取文件?

我尝试使用以下命令来读取文件

lines = sc.textFile("file:///home/cloudera/data/testfile.csv") 

是否需要编写命令的特定格式,或者是否应将文件存储在其他位置。

我在这里遗漏了什么。

0 个答案:

没有答案