标签: pyspark hdfs pyspark-sql biginsights
如何从本地pyspark程序连接和加载远程BigInsights HDFS(启用kerberos身份验证)中的文件以进行处理?
df = sqlContext.read.parquet("hdfs://<<remote_hdfs_host>>:8020/testDirectory")
非常感谢帮助。