我有一个像这样的火花声明:
df.partitionBy("columnA","columnB").parquet("output_folder")
columnA的一个值有一个嵌入的单引号,如下所示: " Jack' Tavern"
它为包含此值的columnA的行生成的输出文件夹的编码为%27A,而不是如下所示的引号:
output_folder/columnA=Jack%27As Tavern
我有一个位于output_folder顶部的impala外部表。我执行show partition时,Impala不会显示此特定分区。
如何让impala识别此分区?