如何用pyspark

时间:2018-05-13 04:32:35

标签: pyspark hdfs parquet

有一些镶木地板文件路径是:

/ A / B / C = 'STR1'/ d = 'STR'

/ A / B / C = 'STR2'/ d = 'STR'

/ A / B / C = 'STR3'/ d = 'STR'

我想阅读这样的镶木地板文件:

df = spark.read.parquet('/a/b/c='*'/d='str')

但是使用"*"通配符无效。我怎么能这样做?谢谢你的帮助

1 个答案:

答案 0 :(得分:0)

你需要转义单引号:

df = spark.read.parquet('/a/b/c=\'*\'/d=\'str\'')

...或者只使用双引号:

df = spark.read.parquet("/a/b/c='*'/d='str'")