toDF()方法的文档指定我们可以将options参数传递给此方法。但是它没有指定这些选项可以是(https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-crawler-pyspark-extensions-dynamic-frame.html)。有谁知道是否还有进一步的文档? 我特别想在从DynamicFrame创建DataFrame时传递模式。
答案 0 :(得分:1)
不幸的是,没有太多可用的文档,但是dynamicframe的研发和源代码分析显示以下内容:
specs
类似,其中也提到ChoiceType。从spark看到specs
,dynamicFrame和toDF的toDF实现之后,我的理解是,从DynamicFrame创建DataFrame时我们无法传递模式,但是只能进行较小的列操作。 / p>
这么说,一种可行的方法是从动态框架中获取一个数据框架,然后对其进行操作以更改其架构。