我有这样的实木复合地板名称:
parquetNames = [NAME1,NAME1_MS,NAME2, NAME2_MQ]
我只想加载NAME1
和NAME2
中的实木复合地板,但是我在负前瞻和交替方面遇到了麻烦。如果我这样做:
s3BaseDir+'NAME*'
然后按预期加载所有实木复合地板目录。在here和here中,我可以像这样进行否定的前瞻,避免使用完整的子字符串"_MS"
或"_MQ"
:
s3BaseDir+'NAME*(?!{_MS,_MQ})'
但是我得到
AnalysisException: 'Path does not exist'
。
似乎从字面上理解了更复杂的正则表达式。
在pyspark spark.read.parquet
中是否可以使用否定前行?是否也可以将其与交替相结合?怎么样?