如何从本地pyspark程序连接和加载远程BigInsights HDFS(启用kerberos身份验证)中的文件以进行处理?

时间:2017-03-17 12:43:54

标签: pyspark hdfs pyspark-sql biginsights

如何从本地pyspark程序连接和加载远程BigInsights HDFS(启用kerberos身份验证)中的文件以进行处理?

df = sqlContext.read.parquet("hdfs://<<remote_hdfs_host>>:8020/testDirectory")

非常感谢帮助。

0 个答案:

没有答案