我正在使用AWS Glue爬网XML文件并将其添加到Glue数据库表中。我正在使用的DynamicFrame
标识XML模式中的几个选择。我可以解决大多数问题,但有一种情况我无法弄清楚。
XML结构的相关部分是:
<root>
<order>
<lineitems>
<lineitem>
...
</lineitem>
</lineitems>
</order>
</root>
我怀疑DynamicFrame
在lineitems
或struct
之间将lineitems/lineitem
显示为choice
,将array
显示为struct
因为某些订单有一个lineitem
,而其他订单有多个lineitems
。我尝试用resolveChoice
调用project:array
,但是结果为element:unknown
,所以我再也看不到lineitem
的结构了。我不确定在这里还能尝试什么,还有什么主意吗?