我正在尝试对记录进行计数并打印分区表的模式(以拼花形式)。我只是在AWS Glue控制台中执行此操作(因为我无权连接到开发人员终端节点)。但是,我不认为我的查询会产生任何结果。请参阅下面的代码。有什么建议吗?
%pyspark
from awsglue.context import GlueContext
from awsglue.transforms import *
from pyspark.context import SparkContext
glueContext = GlueContext(SparkContext.getOrCreate())
datasource0 = glueContext.create_dynamic_frame.from_catalog(database = "s3", table_name = "subscriber", push_down_predicate = "(date=='2018-12-06')", transformation_ctx = "datasource0")
df = datasource0.toDF()
print df.count()
df.printSchema()
答案 0 :(得分:1)